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(57) Abstract 



Hie present invention relates to regulatory DNA sequences containing promoter sequences, in addition to intervening sequences, for 
the human catalytic telomerase sub-unit gene. The invention also relates to the use of said DNA sequences for pharmaceutical, diagnostic 
and therapeutic purposes, especially in the treatment of cancer and ageing. 



(57) Zusamroenfassimg 

Diese Erfindung betrifft regulatorische DNA-Sequenzen, beinhaltend Promotorsequenzen, sowie Intronsequenzen, fiir das Gen der 
humancn kalytischen Telomerase-Untereinheit Dariiber hinaus betrifft diese Erfindung die Verwendung dieser DNA-Sequenzen fur 
pharmazeutische, diagnostische und therapeutische Zwecke, vor allem in der Behandlung von Krebs und Alterung. 



LED1GUCH ZUR INFORMATION 

Codes zur Identifizierung von PCT-Vertragsstaaten auf den Kopfbogen der Schriften, die intemationale Anmeldungen gemass dem 
PCT veroffentlichen. 



AL * 


Albanien 


ES 


Spanien 


LS 


Lesotho 


SI 


Slowenien 


AM 


Annenien 


FI 


Fmnland 


LT 


Litauen 


SK 


Slowakei 


AT 


Ostcrreich 


FR 


Frankreich 


LU 


Luxemburg 


SN 


Senegal 


AU 


Australicn 


GA 


Gabon 


LV 


Lettland 


SZ 


Swasiland 


AZ 


Aserbaidschan 


GB 


Vcremigtcs Kdnigreich 


MC 


Monaco 


TD 


Tschad 



WO 99/33998 



PCT/EP98/08216 

') 



Regulatorische DNA-Sequenzen des Gens der humancn katalytischen 
Telomerase-Untereinheit und deren diagnostische und therapeutische Verwen- 
dung 

5 Aufbau und Funktion der Chromosomenenden 

Das genetische Material eukaryontischer Zellen ist auf linearen Chromosomen 
verteilt. Die Enden der Erbanlagen werden, abgeleitet von den griechischen W6rtern 
telos (Ende) und meros (Teil, Segment), als Telomere bezeichnet. Die meisten 
10 Telomere bestehen aus Wiederholungen von kurzen Sequenzen, die uberwiegend aus 
Thymin und Guanin aufgebaut sind (Zakian, 1995). In alien bislang untersuchten 
Wirbeltieren werden die Telomere aus der Sequenz TTAGGG aufgebaut (Meyne el 
aL, 1989). 

1 5 Die Telomere uben verschiedene wichtige Funktionen aus. Sie verhindern die Fusion 
von Chromosomen (McClintock, 1941) und damit die Entstehung von dizentrischen 
Erbanlagen. Solche Chromosomen mit zwei Centromeren konnen durch Verlust der 
Heterozygotie bzw. Verdopplung oder Verlust von Genen zur Entwicklung von 
Krebs fiihren. 

20 . 

Desweiteren dienen Telomere dazu, intakte Erbanlagen von beschadigten zu unter- 
scheideii. So stellten Hefezellen ihre Zellteilung ein, wenn sie ein Chromosom ohne 
Telomer enthielten (Sandell und Zakian, 1993). 

25 Eine weitere wichtige Aufgabe erfullen Telomere bei der DNA-Replikation 
eukaryontischer Zellen. Im Gegensatz zu den zirkularen Genomen von Prokaryonten 
konnen die linearen Chromosomen der Eukaryonten von dem DNA Polymerase- 
Komplex nicht vollstandig repliziert werden. Zur Initiation der DNA-Replikation 
sind RNA-Primer notwendig. Nach Abspaltung der RNA-Primer, Verlangerung der 

in rti'OToi/-; EVonmonto „nA onwhlipfWdpr T ioatinn fphlt Hem neu-svnthetisierten DNA- 
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werden. Ohne besondere Schutzmechanismen wiirden daher die Chromosomen mit 
jeder Zellteilung schrumpfen ("end-replication problem"; Harley et ai, 1990). Die 
nicht-kodierenden Telomersequenzen stellen vermutlich eine Pufferzone dar, um 
dem Verlust von Genen vorzubeugen (Sandell und Zakian, 1993). 

Daruberhinaus spielen Telomere auch eine wichtige Rolle bei der Regulation der zel- 
lularen Alterung (Olovnikov, 1973). Humane somatische Zellen zeigen in Kultur 
eine limitierte Replikationskapazitat; sie werden nach einer gewissen Zeit seneszent. 
In diesem Zustand teilen sich die Zellen selbst nach Stimulierung mit Wachstumsfak- 
toren nicht mehr, sterben aber nicht, sondern bleiben metabolisch aktiv (Goldstein, 
1990). Verschiedene Beobachtungen sprechen fur die Hypothese, daB eine Zelle an- 
hand der Lange ihrer Telomere bestimmt, wie oft sie sich noch teilen kann (Allsopp 
era/., 1992). 

Zusammenfassend besitzen die Telomere somit zentrale Funktionen bei der Alterung 
von Zellen sowie der Stabilisierung des genetischen Materials und Verhinderung von 
Krebs. 

Das Enzym Telomerase synthetisiert die Telomere 

Wie oben beschrieben konnen Organismen mit linearen Chromosomen ohne einen 
speziellen Schutzmechanismus ihr Genom nur unvollstandig replizieren. Die meisten 
Eukaryonten verwenden zur Regeneration der Telomersequenzen ein spezielles En- 
zym, die Telomerase. In den bislang untersuchten Einzellem wird Telomerase konsti- 
tutiv exprimiert. Dagegen wurde in Menschen die Telomerase-Aktivitat nur in Keim- 
zellen und Tumorzellen gemessen, wogegen benachbartes somatisches Gewebe keine 
Telomerase enthielt (Kim et al.,\ 994). 

Funktionell kann die Telomerase auch als terminale Telomertransferase bezeichnet 



WO 99/33998 



3 



PCT/EP98/08216 



wurde kiirzlich die katalytische Untereinheit dieser Enzymgruppe in verschiedenen 
Organismen identifiziert (Lingner et al, 1997; vgl. unsere ebenfalls anhangige 
. Anmeldung PCT EP/98/03468). Diese katalytischen Untereinheiten der Telomerase 
sind sowohl untereinander als auch zu bisher alien bekannten reversen Transkriptasen 
5 auffallig homolog. 

Auch in WO 98/14592 werden Nukleinsaure- und Aminosauresequenzen der 
katalytischen Telomerase-Untereinheit beschrieben. 

10 Aktivierung der Telomerase in menschlichen Tumoren 

Eine Aktivitat der Telomerase konnte in Menschen ursprunglich nur in Keimbahnzel- 
len, nicht aber in normalen somatischen Zellen (Hastie et al, 1990; Kim et al, 1994) 
nachgevviesen werden. Nach der Entwicklung eines sensitiveren Nachweisverfahrens 

1 5 (Kim et al , 1 994) wurde auch in hematopoietischen Zellen eine geringe Telomerase- 
aktivitat detektiert (Broccoli et al, 1995; Counter et al, 1995; Hiyama et al, 1995). 
Allerdings wiesen diese Zellen trotzdem eine Reduktion der Telomere auf (Vaziri et 
al, 1994; Counter et al, 1995). Noch ist nicht geklart, ob die Menge an Enzym in 
■ diesen Zellen nicht ausreichend fur eine Kompensation des Telomerverlustes ist, oder 

20 ob die gemessene Telomerase-Aktivitat von einer Subpopulation, z.B. unvollstandig 
ausdifferenzierten CD34 + 38 + -Vorlauferzellen, herriihrt (Hiyama et al, 1995). Zur 
Klarung ware ein Nachweis der Telomerase-Aktivitat in einer einzelnen Zelle notig. 

Interessanterweise wurde jedoch in einer groflen Zahl der bislang getesteten Tumor- 
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che Befunde aus Untersuchungen an Mausen (Blasco et di 9 1996) stiitzen die An- 
nahme, daB eine Reaktivierung der Telomerase ein spates Ereignis in der Tumorge- 
nese ist. 

Basierend auf diesen Ergebnissen wurde eine "Telomerase-Hypothese" entwickelt, 
die den Verlust von Telomersequenzen und Zellalterung mit der Aktivitat von 
Telomerase und der Entstehung von Krebs verbindet. In langlebigen Spezies wie 
dem Menschen kann das Schrumpfen der Telomere als ein Mechanismus zur Tumor- 
suppression angesehen werden. Ausdifferenzierte Zellen, die keine Telomerase 
enthalten, stellen bei einer bestimmten Lange der Telomere ihre Zellteilung ein. 
Mutiert eine solche Zelle, so kann aus ihr nur dann ein Tumor entstehen. wenn die 
Zelle ihre Telomere verlangern kann. Ansonsten wurde die Zelle weiterhin Telomer- 
sequenzen verlieren, bis ihre Chromosomen instabil werden und sie schliefllich zu- 
grunde geht. Die Reaktivierung der Telomerase ist vermutlich der Hauptmechanis- 
mus von Tumorzellen zur Stabilisation ihrer Telomere. 

Aus diesen Beobachtungen und Uberlegungen ergibt sich, daB eine Inhibition der Te- 
lomerase eine Therapie von Tumoren erlauben sollte. Konventionelle Krebstherapien 
mit Zytostatika oder kurzwelligen Strahlen schadigen nicht nur die Tumorzellen, 
sondern alle sich teilenden Zellen des Korpers. Da aber aufier Tumorzellen nur 
Keimbahnzellen eine signifikante Telomerase-Aktivitat enthalten. wiirden Telome- 
rase-Inhibitoren spezifischer die Tumorzellen angreifen und somit weniger uner- 
vviinschte Nebenwirkungen hervorrufen. In alien bislang getesteten Tumorgeweben 
wurde eine Telomerase-Aktivitat nachgewiesen, so daB diese Therapeutika gegen alle 
Krebsarten eingesetzt werden konnten. Die Wirkung von Telomerase-Inliibitoren 
wurde dann eintreten, wenn die Telomere der Zellen sich soweit verkiirzt haben, daB 
das Genom instabil wird. Da Tumorzellen meist kiirzere Telomere aufweisen als 
normale somatische Zellen, wiirden zuerst Krebszellen durch Telomerase-Inhibitoren 
eliminiert werden. Zellen mit langen Telomeren, wie die Keimzellen, wiirden 
dagegen erst viel spater geschadigt werden. Telomerase-Inhibitoren stellen somit 
einen zukunftsweisenden Weg fur die Therapierung von Krebs dar. 
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Eindeutige Antworten auf die Frage nach der Art und den Angriffspunkten physiolo- 
gischer Telomerase-Inhibitoren werden moglich sein, wenn auch die Regulation der 
Genexpression der Telomerase identifiziert ist. 

5 

Regulation der Genexpression in Eukaryonten 

. Die eukaryotische Genexpression, d.h. der zellulare InformationsfluB von der DNA 
uber die RNA zum Protein, weist vielfaltige Ansatzpunkte fur regulatorische Mecha- 
10 nismen auf. Einzelne Kontrollstufen sind z.B. die Gen-Amplifikation, Rekombina- 
tion von Genloci, Chromatinstruktur, DNA-Methylierung, Transkription, posttrans- 
kriptionelle mRNA-Modifikationen, mRNA-Transport, Translation und post-trans- 
;v lationale Proteinmodifikationen. Nach bisherigen Studien besitzt die Kontrolle auf 
der Ebene der Transkriptionsinitiation die groBte Bedeutung (Latchnian, 1991). 

15 

Unmittelbar stromaufwarts vom Transkriptionsstart eines von der RNA-Polymerase 
II transkribierten Gens liegt eine Region, die fur die Steuerung der Transkription ver- 
antwortlich ist und als Promotorregion bezeichnet wird. Ein Vergleich der Nukleo- 
tidsequenzen von Promotorregionen vieler bekannter Gene zeigt. daB bestimmte 

20 Sequenzmotive in dieser Region hauftg vorkommen. Zu diesen Elementen gehoren 
unter anderem die TATA-Box, die CCAAT-Box und die GC-Box, die von spezifi- 
schen Proteinen erkannt werden. Die TATA-Box, die etwa 30 Nukleotide stromauf- 
warts vom Transkriptionsstart entfernt positioniert ist, wird z.B. von der TFIID- 
Untereinheit TBP („TATA-box binding protein") erkannt, wogegen bestimmte GC- 

25 reiche Sequenzabschnitte vom Transkriptionsfaktor Spl („specificity protein 1") spe- 
zifisch gebunden werden. 

Funktionell kann man den Promotor in einen regulativen und einen konstitutiven Ab- 
schnitt unterteilen (Latchman, 1991). Der konstitutive Kontrollbereich umfaBt den 
30 sogenannten Kernpromotor („corepromoter"), der die korrekte Initiation der Trans- 
kription ermoglicht. Er enthalt die als UPE's (upstream promoter elements") be- 
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schriebenen Sequenzelemente, die fur eine effiziente Transkription notwendig sind. 
Die regulativen Kontrollabschnitte, die mit den UPE's verflochten sein konnen, 
weisen Sequenzelemente auf, die an der signalabhangigen Regulation der Trans- 
kription durch Hormone, Wachstumsfaktoren usw. beteiligt sein konnen. Sie ver- 
5 mitteln gewebs- oder zellspezifische Promotoreigenschaften. 

Ein charakteristisches Merkmal eukaryotischer Gene sind DNA-Abschnitte, die iiber 
vergleichsweise grofie Distanzen hinweg EinfluB auf die Genexpression nehmen kon- 
nen. Diese Elemente konnen stromaurwarts, stromabwarts oder innerhalb einer 
10 Transkriptionseinheit lokalisiert sein und unabhangig von ihrer Orientierung ihre 
Funktion wahrnehmen. Diese Sequenzabschnitte konnen die Promotoraktivitat ver- 
starken (Enhancer) oder abschwachen (Silencer). Ahnlich wie die Promotorregionen 
beherbergen auch Enhancer und Silencer mehrere Bindungsstellen fur Transkrip- 
tionsfaktoren. 

15 

Die Erfindung betrifft die DNA-Sequenzen aus der 5'-flankierenden Region des 
Gens der katalytisch aktiven humanen Telomerase-Untereinheit sowie Intron- 
Sequenzen fur dieses Gen. 

20 Die Erfindung betrifft insbesondere die 5'-flankierende regulatorische DNA- 
Sequenz, enthaltend die Promotor-DNA-Sequenz fur das Gen der humanen 
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Die Erfmdung betrifft weiterhin ein rekombinantes Konstrukt, das die erfindungsge- 
mafien DNA-Sequenzen, insbesondere die 5'-flankierende DNA-Sequenz des Gens 
der humanen katalytischen Telomerase Untereinheit oder Teilbereiche davon 
5 beinhaltet. 

Bevorzugt sind rekombinante Konstrukte, die neben den erfindungsgemaBen DNA- 
Sequenzen,. insbesondere der 5'-flankierenden DNA-Sequenz des Gens der humanen 
katalytischen Telomerase Untereinheit oder Teilbereichen davon, eine oder mehrere 
1 0 . weitere DNA-Sequenzen, die ftir Polypeptide oder Proteine kodieren, enthalten. 

GemaB einer besonders bevorzugten Ausfuhrungsform kodieren diese weiteren 
DNA-Sequenzen ftir antitumorale Proteine. 

15 Besonders bevorzugte antitumorale Proteine sirid solche, die die Angiogenese direkt 
oder indirekt inhibieren. Zu diesen Proteinen zahlen beispielsweise: 

Plasminogenaktivatorinhibitor (PAI-1), PAI-2, PAI-3, Angiostatin, Endostatin, 
. Platelet factor 4, TIMP-1, TIMP-2, TIMP-3, Leukemia Inhibitory Factor (LIF). 

20 

Ebenfalls besonders bevorzugt sind antitumorale Proteine, welche direkt oder 
indirekt eine zytostatische Wirkung auf Tumoren aufweisen. Hierzu zahlen im 
besonderen: 

25 Perforin, Granzym, IL-2, IL-4, IL-12, Interferone, wie beispielsweise IFN-a, IFN-B, 
IFN-y, TNF, TNF-a, TNF-B, Oncostatin M; Tumorsuppressorgene, wie z.B. p53, 
Retinoblastoma. 

Weiterhin besonders bevorzugt sind antitumorale Proteine, welche gegebenenfalls 
30 zusatzlich zur antitumoralen Wirkung Entzundungen stimulieren und hierdurch zur 
Elimination von Tumorzellen beitragen. Hierzu zahlen beispielsweise: 



WO 99/33998 PCT/EP98/0821 6 



RANTES, Monocyte chemotactic and activating factor (MCAF), IL-8, Macrophage 
inflammatory protein (MIP-lct,-B), Neutrophil activating protein-2 (NAP-2), IL-3, 
IL-5, human leukemia inhibitory factor (LIF), IL-7, IL-1 1, IL-13, GM-CSF, G-CSF, 
5~ M-CSF. 

Weiterhin besonders bevorzugt sind antitumorale Proteine, welche aufgrund ihrer 
Wirkung als Enzyme in der Lage sind, Vorstufen eines antitumdralen Wirkstoffes in 
einen antitumoralen Wirkstoff zu iiberfiihren. Zu diesen Enzymen zahlen beispiels- 
10 vveise: 

Herpes Simplex Virus Thymidinkinase, Varizella Zoster Virus Thymidinkinase, bak- 
terielle Nitroreductase, bakterielle B- Glukuronidase, pflanzliche B-Glukuronidase 
aus Secale careale, humane Glukuronidase, humane Carboxypeptidase, bakterielle 
15 Carboxypeptidase, bakterielle B-Lactamase, bakterielle Cytosindeaminidase, humane 
Katalase bzw. Phosphatase, humane alkalische Phosphatase, Typ 5 saure Phospha- 
tase, humane Lysooxidase, humane saure D-Aminooxidase, humane Glutathion 
Peroxidase, humane Eosinophilen Peroxidase, humane Schilddrusen Peroxidase. 

20 Die obengenannten rekombinanten Konstrukte konnen auch DNA-Sequenzen enthal- 
ten, die fur Faktor VIII, IX oder Teilfragmente davon kodieren. Zu diesen DNA- 
Sequenzen zahlen auch andere Blutgerinnungsfaktoren 

Die obengenannten rekombinanten Konstrukte konnen auch DNA-Sequenzen enthal- 
25 ten, die fur ein Reporterprotein kodieren. Zu diesen Reporterproteinen zahlen bei- 
spielsweise: 

Chloramphenicolacetyltransferase (CAT), Gluhwiirmchen Luziferase (LUC), B- 
Galaktosidase (B-Gal), Sezernierte alkalische Phosphatase (SEAP), Humanes 
30 Wachstumshormon (hGH), B-Glukuronidase (GUS), Grun-fluoreszierendes Protein 
(GFP) und alie davon abgeleiteten Varianten, Aquarin, Obelin. 
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ErfindungsgemaBe rekombinante Konstrukte konnen auch DNA kodierend fur die 
humane katalytische Telomerase Untereinheit und deren Varianten und Fragmente in 
antisense Orientierung enthalten. Gegebenenfalls konnen diese Konstrukte auch 
andere Protein-Untereinheiten der humanen Telomerase und die Telomerase-RNA- 
Komponente in antisense Orientierung enthalten. 

Die rekombinanten Konstrukte konnen neben der DNA, kodierend fur die humane 
katalytische Telomerase Untereinheit, sowie deren Varianten und Fragmente auch 
andere Protein-Untereinheiten der humanen Telomerase und die Telomerase-RNA- 
Komponente enthalten. 

-Die Erfindung betrifft weiterhin einen Vektor, enthaltend die oben genannten erfin- 
dungsgemaBen DNA-Sequenzen, insbesondere die 5'-flankierenden DNA-Sequen- 
zen, sowie eine oder mehrere der oben genannten anderen DNA-Sequenzen. 

Bevorzugter Vektor fur solche Konstrukte ist ein Virus, beispielsweise ein Retrovi- 
rus, Adenovirus, adeno-assoziiertes Virus, Herpes Simplex Virus, Vaccina Virus, 
lentivirales Virus, Sindbis Virus und ein Semliki Forest Virus. 

Ebenfalls bevorzugt sind Plasmide als Vektoren. 

Die Erfindung betrifft .weiterhin pharmazeutische Praparate, enthaltend erfin- 
dungsgemaBe rekombinante Konstrukte bzw. Vektoren; beispielsweise eine Zube- 
reitung in einem kolloidalen Dispersionssystem. 

Geeignete koiloidale Dispersionssysteme sind beispielsweise Liposome oder Polyly- 
sin-Liganden. 

Die Zubereitungen der erfindungsgemalJen Konstrukte bzw. Vektoren in kolloidalen 
Dispersionssystemen konnen um einen Liganden erganzt sein, der an Membranstruk- 
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turen von Tumorzellen bindet. Ein solcher Ligand kann z.B. an das Konstrukt bzw. 
den Vektor angeknupft sein oder auch Bestandteil der Liposomenstruktur sein. 

Geeignete Liganden sind insbesondere polyklonale oder monoklonale Antikdrper 
oder Antikorperfragmente hiervon, die mit ihren variablen Domanen an Membran- 
strukturen von Tumorzellen binden, oder endstandige Mannose-tragende Substanzen, 
Zytokine, Wachstumsfaktoren oder Fragmente bzw. Teilsequenzen hiervon, die an 
Rezeptoren auf Tumorzellen binden. 

Entsprechende Membranstrukturen sind beispielsweise Rezeptoren fur ein Zytokin 
oder einen Wachstumsfaktor, wie z.B. IL-1, EGF, PDGF, VEGF, TGF B, Insulin 
oder Insulin-like Growth Factor (ILGF), oder Adhasionsmolekule, wie z. B. SLeX, 
LFA-1, MAC-1, LECAM-1 oder VLA-4, oder der Mannose-6-Phosphat-Rezeptor. 

Zur vorliegenden Erfindung gehoreri pharmazeutische Zubereitungen, die neben den 
erfindungsgemaBen Vektorkonstrukten auch nichttoxische, inerte, pharmazeutisch 
geeignete Tragerstoffe enthalten konnen. Vorstellbar sind die Applikation (z.B. intra- 
venos, intraarteriell, intramuskular, subkutan, intradermal, anal, vaginal, nasal, trans- 
dermal, intraperitonal, als Aerosol oder oral) am Ort eines Tumors oder die syste- 
mische Applikation dieser Zubereitungen. 

Die erfindungsgemaCen Vektorkonstrukte konnen in der Gentherapie eingesetzt wer- 
den. 

Die Erfindung betrifft weiterhin eine rekombinante Wirtszelle, insbesondere eine 
rekombinante eukaryotische Wirtszelle, enthaltend die vorstehend beschriebenen 
Konstrukte bzw. Vektoren. 

Die Erfindung betrifft weiterhin ein Verfahren zur Identifizierung von Substanzen, 
die die Promotor-, Silencer- oder Enhanceraktivitat der katalytischen Telomerase 
Untereinheit beeinflussen, wobei dieses Verfahren folgende Schritte.umfaBt: 
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A. Zugabe einer Kandidatensubstanz zu einer Wirtszelle, enthaltend die 
erfindungsgemaCe regulatorische DNA-Sequenz, insbesondere die S'-flankie- 
rende regulatorische DNA-Sequenz fur das Gen der humanen katalytischen 

5 Telomerase-Untereinheit oder einen regulatorisch wirksamen Teilbereich 

davon, funktionell verknupft mit einem Reportergen, 

B. Messung des Substanzeffektes auf die Reportergenexpression. 

10 Das Verfahren kann eingesetzt werden zur Identifizierung von Substanzen, die die 
Promoter-, Silencer- oder Enhanceraktivitat der katalytischen Telomerase Unterein- 
heit verstarken. 

Das Verfahren kann weiterhin eingesetzt werden zur Identifizierung von Substanzen, 
15 die die Promotor-, Silencer- oder Enhanceraktivitat der katalytischen Telomerase 
Untereinheit inhibieren. 

Die Erfindung betrifft weiterhin ein Verfahren zur Identifizierung von Faktoren, die 
spezifisch an Fragmente der erfindungsgemaBen DNA-Fragmente, insbesondere der 
20 5'-flankierenden regulatorischen DNA-Sequenz der katalytischen Telomerase 
Untereinheit, binden. Diese Methode beinhaltet ein Screening einer Expressions- 
cDNA-Bibliothek mit der vorstehend beschriebenen DNA-Sequenz oder Teilfrag- 
menten unterschiedlichster Lange als Sonde. 

25 Die vorstehend beschriebenen Konstrukte bzw. Vektoren konnen auch zur Her- 
stellung transgener Tiere verwendet werden. 

Die Erfindung betrifft weiterhin ein Verfahren zur Detektion Telomerase-assoziierter 
Zustande bei einem Patienten, das folgende Schritte umfaBt: 
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A. Inkubation eines Konstruktes bzw. Vektors, enthaltend die erfindungsgemafle 
DNA-Sequenz, insbesondere die 5-flankierende regulatorische DNA- 
Sequenz fur das Gen der humanen katalytischen Telomerase-Untereinheit 
oder einen regulatorisch wirksamen Teilbereich davon sowie ein Reportergen 

5 mit Korperflussigkeiten oder zellularen Proben, 

B. Detektion der Reportergenaktivitat, urn einen diagnostischen Wert zu 
erhalten; 



10 C. Vergleich des diagnostischen Werts mit Standardwerten fur das Reportergen- 
konstrukt in standardisierten normalen Zellen oder Korperflussigkeiten des 
gleichen Typs wie die Testprobe; 

Detektion diagnostischer Werte, die hdher oder niedriger als Standardvergleichswerte 
1 5 Iiegen, indiziert einen Telomerase-assoziierten Zustand, der wiederum einen pathoge- 
nen Zustand indiziert. 



Erlauterung der Abbildungen: 



20 Fig. 1 : Southern Blot-Analyse mit genomischer DNA verschiedener Spezies 

A: Foto eines Ethidiumbromid gefarbten 0,7 %igen Agarosegels mit etwa 
4 jig Eco RI geschnittener genomischer DNA. Die Spur 1 enthalt Hind III 
geschnittene X-DNA als GroBenmarker (23,5, 9,4, 6,7, 4,4, 2,3, 2,0, und 
25 0,6 kb). Die Spuren 2 bis 10 enthalten genomische DNA von Mensch, 

Rhesusaffe, Spraque Davvley Ratte, BALB/c Maus, Hund, Rind, 
Kaninchen, Huhn und Hefe (Saccharomyces cerevisiae). 

B: Zu Fig.l A korrespondierendes Autoradiogramm einer Southern Blot- 
30 Analyse, hybridisiert mit einer radioaktiv-markierten etwa 720 bp langen 

hTC-cDNA Sonde. 
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Fig. 2: Restriktionsanalyse der rekombinanten X-DNA des Phagenklons PI 2, der 
mit einer Sonde aus dem 5'-Bereich der hTC-cDNA hybridisiert. 

5 Die Abbildung zeigt ein Foto eines Ethidiumbromid gefarbten 0,4 %igen 

Agarosegels. Die Spuren 1 und 2 enthalten Eco RI/Hind III gesclinittene 
X-DNA bzw eine 1 kb Leiter der Firma Gibco als Grofienmarker. Die 
Spuren 3 - 7 enhalten 250 ng mit Bam HI (Spur 3), Eco RI (Spur 4), Sal I 
(Spur 5), Xho I (Spur 6) und Sac I (Spur 7) geschnittene DN A des 
10 rekombinanten Phagens. Die Pfeile kennzeichnen die zwei \-Avme des 

Vektors EMBL3 Sp6/T7. 

Fig. 3: Restriktionsanalyse und Southern Blot-Analyse der rekombinanten X- 
DNA des Phagenklons, der mit einer Sonde aus dem 5'-Bereich der hTC- 
15 cDN A hybridisiert. 



A: Die Abbildung zeigt ein Foto eines Ethidiumbromid gefarbten 
0,8%igen Agarosegels. Die Spuren 1 und 15 enthalten eine 1 kb Leiter 
der Firma Gibco als Grofienmarker. Die Spuren 2 bis 14 enthalten 250 ng 

20 geschnittene X-DNA vom rekombinanten Phagenklon. Als Enzyme 

wurden eingesetzt: Spur 2: Sac I, Spur 3: Xho I, Spur 4: Xho I, Xba I, 
Spur 5: Sac I, Xho I, Spur 6: Sal I, Xho I, Xba I, Spur 7: Sac I, Xho I, 
Xba I, Spur 8: Sac I, Sal I, Xba I, Spur 9: Sac I, Sal I, BamH I, Spur 10: 
Sac I, Sal I, Xho I, Spur 11: Not I, Spur 12: Sma I, Spur 13: leer, Spur 

25 14: nicht verdaut. 

B: Zu Fig.3 A korrespondierendes Autoradiogramm einer Southern Blot- 
Analyse. Als Sonde fur die Hybridisierung vvurde ein etwa 420 bp langes 
5'-hTC-cDNA Fragment eingesetzt. 
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Fig. 4: Partielle DNA-Sequenz der 5'-flankierenden Region und des Promoters 
vom Gen der humanen katalytischen Telomerase-Untereinheit. Das 
ATG-Startcodon ist in der Sequenz fett hervorgehoben. Die dargestellte 
Sequenz entspricht SEQ ID NO 1. 

5 

Fig. 5: Identifizierung des Transkriptionsstarts durch Primer Extension-Analyse. 



Die Abbildung zeigt ein Autoradiogramm eines denaturierenden Poly- 
acrylamidgels, welches zur Darstellung einer Primer Extension-Analyse 

10 gewahlt vvurde. Als Primer wurde ein Oligonukleotid mit der Sequenz 

5'GTTAAGTTGTAGCTTACACTGGTTCTC 3' benutzt. In der Spur 1 
wurde die Primer Extension Reaktion aufgetragen. Die Spuren G, A, T, 
C, stellen die Sequenzreaktionen mit dem gleichen Primer und den ent- 
sprechenden Dideoxynukleotiden dar. Der fette Pfeil kennzeichnet den 

15 Haupt-Transkriptionsstart, die dunnen Pfeile weisen auf drei Neben- 

Transkriptionsstartpunkte hin. 



Fig. 6: cDNA Sequenz der humanen katalytischen Telomerase-Untereinheit 
(hTC; vgl. unsere anhangige Anmeldung PCT/EP/98/0346S). Die 
20 dargestellte Sequenz entspricht SEQ ID NO 2. 

Fig. 7: Strukturelle Organisation und Restriktionsmappe des humanen hTC- 
Gens und dessen 5'- und 3'-flankierende Region. 

25 Exons sind als durchnummerierte schwarz ausgefiillte Rechtecke und 

Introns als nicht ausgefiillte Bereiche hervorgehoben. Nichttranslatierte 
Sequenzabschnitte in den Exons sind schraffiert. Die Translation startet 
in Exon 1 und endet in Exon 16. Restriktionsenzymschnittstellen sind 
wie folgt gekennzeichnet: S, Sad; X, Xhol. Die relative Anordnung der 

30 fiinf Phagenklone (P2, P3, P5, P12, P17) und des Produktes aus dem 

^Genomic walking" sind durch dunne Linien hervorgehoben. Wie durch 



15 



. die Punkte gekennzeichnet, ist die Sequenz von Intron 16 nur teilweise 
entschliisselt. 

HTL Splicevarianten. 

A: Schematische Struktur der hTC mRNA Splicevarianten. Die voll- 
standige hTC mRNA ist als grau unterlegtes Rechteck im oberen Bereich 
der Abb. dargestellt. Die 16 Exons sind entsprechend ihrer GroBe 
. dargestellt. Der Translationsstart (ATG) und das Stop-Codon, sovvie das 
Telomerase-spezifische T-Motiv und die sieben RT-Motive sind hervor- 
gehoben. Die hTC-Varianten sind in Deletions- und Insertionsvarianten 
unterteilt. In den Deletionen sind die fehlenden Exonsequenzen markiert. 
Die Insertionen sind durch zusatzliche weiBe Rechtecke hervorgehoben. 
GroBe und Herkunft der insertierten Sequenzen sind angegeben. Neu 
entstandene Stop-Codons sind markiert. Die GroBe der Insertion von 
Variante INS2 ist unbekannt. 

B: Exon Intron Ubergange der hTC-Splice-Varianten. Nichtgesplicte 5'- 
und 3'-flankierte Sequenzen sind als weiBe Rechtecke hervorgehoben. 
Die Herkunft der Exon und Intron Sequenzen ist angegeben. Intron und 
Exon Sequenzen sind in Kleinbuchstaben, bzvv. in GroBbuchstaben 
dargestellt. Die Donor und Akzeptor Sequenzen der Splicestellen sind als 
graue Rechtecke unterlegt und deren Exon Intron Herkunft ist ebenfalls 
angegeben. 

Identifizierung des Transkriptionsstarts durch RT-PCR Analyse. 
Die RT-PCR wurde mit cDNA-Bibliothek aus HL 60 Zellen und ge- 
nomischer DNA als Positivkontrolle durchgefiihrt. Ein gemeinsamer 3'- 
Primer hybridisiert an eine Sequenzregion aus Exon 1. Die Position der 
verschiedenen 5' Primer in der kodierenden Region oder der 5'- 
flankierenden Region ist angegeben. In der Negativkontrolle wurde keine 
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Template-DNA in der PCR-Reaktion zugegeben. M: DNA-Grofien- 
marker. 

Fig. 10: Nukleotidsequenz und Strukturmerkmale des hTC-Promotors. 
.5 11273 bp der 5 '-flankierenden hTC Gensequenz, beginnend mit dem 

Translationsstartcodon ATG (+1) sind dargestellt. Die putative Region 
des Translationsstarts ist unterstrichen. Mogliche regulatorische Sequenz- 
abschnitte innerhalb der 4000 bp stromaufwarts des Translationsstarts 
sind umrandet. Die dargestellte Sequenz entspricht SEQ ID NO 3. 

10 

Fig. 1 1 : Aktivitat des hTC-Promotors in HEK-293 Zellen. 

Im oberen Bereich der Abbildung sind die ersten 5000 bp der 5'- 
flankierenden hTC Genregion schematise!) dargestellt. Das ATG- 
Startcodon ist hervorgehoben. CpG reiche Inseln sind durch graue 

15 Rechtecke markiert. Auf der linken Abbildungsseite sind die GroCen der 

hTC Promotor-Luziferase Konstukte dargestellt. Das pomotorlose pGL2- 
Basic Konstrukt und das SV40 Promotorkonstrukt pGL2-Pro wurden in 
jeder Transfektion als Kontrollen eingesetzt. Auf der rechten Abbil- 
dungsseite sind ist die relative Luziferaseaktivitat der verschiedenen 

20 Promotorkonstukte in HEK-Zellen als durchgehende Balken gezeigt. Die 

Standardabweichung ist angegeben. Die Zahlenwerte reprasentieren den 
Durchschnitt von zwei unabhangigen Experimented die in Duplikaten 
durchgefuhrt wurden. 

25 Tab. I : Exon Intron Ubergange des hTC-Gens 

Aufgelistet sind die Nukleotidsequenzen an den 3'- und 5' 
Spliceiibergangen des hTC-Gens. Die Konsensussequenzen fur Donor 
und Akzeptorsequenzen (AG und GT) sind durch graue Rechtecke 
unterlegt. Intronsequenzen (Kleinbuchstaben) und Exonsequenzen (GroC- 

30 - buchstaben), die die Spliceakzeptor- und Donorstellen flankieren sind 

gezeigt. Die GroBe der Exons und Introns ist in bp angegeben. 
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Tab. 2: Potentielle Bindungsstellen fur DNA-bindende Faktoren in der 
Nukleotidsequenz von Intron 2 

5 Die Suche nach moglichen DNA-bindenden Faktoren (z.B. Transkrip- 

tionsfaktoren) wurde mit dem „Find Pattern"-Algorithmuses aus dem 
M GCG Sequenz Analysis" Programmpacket der „Genetics Computer 
Group" (Madison, USA) durchgefuhrt. Aufgelistet sind die Abkiirzungen 
der identifizierten DNA-bindenden Faktoren und deren Lokalisation in 
10 Intron 2. 
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Tab. 2 



Faktoren 


Lokalisation in Intron 2 


C/EBP 


2925 


CRE.2 


2749 


Spl 


2378, 4094, 4526, 4787, 4835, 4995 


AP-2 CS3 


5099 


AP-2 CS4 


2213, 3699, 4667, 5878, 5938, 6059, 6180, 6496 


AP-2 CS5 


5350, 5798, 5880, 5940, 6061, 6182, 6375, 6498 


PEA3 


934, 2505 


P53. 


2125 


GR uteroglobin 


848, 1487, 2956 


PR uteroglobin 


3331 


Zeste-white 


1577, 1619, 1703, 1745, 1787, 1829, 1871, 1913, 1955, 
1997, 2039, 2081, 3518, 3709, 4765, 5014, 5055 


GRE 


846 


MyoD^MCK right 
site/rev 


447, 509, 558, 1370, 1595, 1900, 2028, 2099, 4557 


MyoD-MCK left site 


108, 118, 453, 1566, 1608, 1692, 1734, 1818, 1902, 
1986, 2372, 2460, 2720, 3491, 5030 


Ets-1 CS 


6408 


API 


3784, 4406 


CREB 


2801 


p i T A 1 

GATA-1 


0*50 nOrt "3 1 C/1 


c-Myc 


108, 118, 453, 1566, 1608, 1692, 1734, 1818, 1902, 
1986, 2372, 2460, 2720, 3491, 5030 


CACCC site 


991 


CCAAT site 


1224 


CCAC box 


992 


CAAT site 


463, 2395 


Rb site 


992, 4663 


TATA 


3650 


CDEI 


106, 1564, 1606, 1690, 1732, 1816, 1900, 1984 
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Beispiele 

Das menschliche Gen fiir die katalytische Telomerase Untereinheit (ghTC), sowie die 
5' und 3' liegenden Bereiche dieses Gens wurden kloniert, der Startpunkt der 
5 Transkription bestimmt, potentielle Bindungsstellen fiir DNA-bindende Proteine 
identifiziert, sowie aktive Promotorfragmente aufgezeigt. Die Sequenz der hTC- 
cDNA (Fig. 6) ist bereits in unserer ebenfalls anhangigen Anmeldung 
PCT/EP/98/03468 beschrieben. Wenn nicht gesondert erwahnt, beziehen sich samt- 
liche Angaben zur cDNA-Position auf diese Sequenz. 

10 

Beispiel 1 

Durch eine genomische Southern Blot-Analyse wurde bestimmt, ob ghTC im 
menschlichen Genom ein Einzelgen darstellt oder mehrere Loci fiir das hTC-Gen 
15 bzw. eventuell auch ghTC-Pseudogene existieren. 

Hierzu wurde ein kommerziell erhaltlicher Zoo-Blot der Firma Clontech einer 
Southern Blot-Analyse unterzogen. Dieser Blot enthalt 4 p.g Eco RI geschnittene 
genomische DNA von neun verschiedenen Spezies (Mensch, Affe, Ratte, Maus, 

20 Hund, Rind, Kaninchen, Huhn und Hefe). Mit Ausnahme von Hefe, Huhn und 
Mensch wurde die DNA aus Nierengewebe isoliert. Die humane genomische DNA 
wurde aus Plazenta isoliert und die genomische DNA aus Huhn wurde aus Leberge- 
webe aufgereinigt. Im Autoradiogramm in Fig. 1 wurde als radioaktiv-markierte 
Sonde ein etwa 720 bp langes hTC.-cDNA Fragment, isoliert aus der hTC cDNA, 

25 Variante Del2 (Position 1685 bis 2349 plus 2531 bis 2590 der Fig. 6 [Deletion 2; 
vergl. Beispiel 5 der Fig. 8]), eingesetzt. Die experimentellen Bedingungen fiir die 
Hybridisierung und die Waschschritte des Blots erfolgten in Anlehnung an Ausubel 
etal (1987). 
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Im Fall der humanen DNA erkennt die Sonde zwei spezifische DNA-Fragmente. Das 
kleinere, etwa 1,5 bis 1,8 kb lange Eco RI-Fragment geht wahrscheinlich auf zwei 
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Eco Rl-Schnittstellen in einem Intron der ghTC-DNA zuriick. Aufgrund dieses 
Ergebnisses ist davon auszugehen, daB nur ein singulares ghTC-Gen im 
menschlichen Genom vorliegt. 

5 Beispiel 2 : 

Zur Isolierung der 5' flankierenden hTC-Gensequenz wurden ca 1,5 x 10 6 Phagen 
einer humanen genomischen Plazenta-Genbibliothek (EMBL 3 SP6/T7 der Firma 
Clontech, Bestellnummer HL1067j) auf Nitrozellulosefilter (0,45 Jim; Fa. Schleicher 

10 und Schuell) nach Angaben des Herstellers mit einem radioaktiv markierten, etwa 
500 bp langen 5'-hTC-cDNA Fragment (Position 839 bis 1345 der Fig. 6) 
hybridisiert. Die Nitrozellulosefilter wurden zunachst in 2 x SSC (0,3 M NaCl; 0,5 M 
Tris-HCl, pH 8,0) und anschliefiend in einer Prahybridisierungslosung (50 % 
Formamid; 5 x SSPE, pH 7,4; 5 x Denhards-Losung; 0,25 % SDS; 100 ng/ml 

15 Heringsperma-DNA) zwei Stunden bei 42°C inkubiert. Fur die Hybrididsierung uber 
Nacht wurde die Prahybridisierungslosung mit 1,5 x 10 6 cpm/ml Losung dena- 
turierter, radioaktiv markierter Probe erganzt. Unspezifisch gebundene, radioaktive 
DNA wurde unter stringenten Bedingungen, d.h. durch drei funfminutige Wasch- 
schritte mit 2 x SSC; 0,1 % SDS bei 55 bis 65 °C entfernt. Die Auswertung erfolgte 

20 durch Autoradiographic der Filter. 

Die in dieser Primaruntersuchung identifizierten Phagenklone wurden aufgereinigt 
Ausubel et al (1987). In weitergehenden Analysen stellte sich ein Phagenklon P12 
als potentiell positiv heraus. Eine k-DNA Preparation dieses Phagens Ausubel et al 
25 (1987) und der nachfolgende Restriktionsverdau mit Enzymen, die das genomische 
Insert in Fragmenten freisetzen, zeigte, daB dieser Phagenklon ein ca. 15 kb Insert im 
Vektor enthalt (Fig. 2). 

Zur Isolierung der vollstandigen hTC-Gensequenz wurden in unabhangigen 
30 Experimenten jeweils 1 bis 1,5 x 10 6 Phagen mit jeweils verschiedenen radioaktiv 
markierten Sonden wie oben beschrieben durchmustert. 
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Die in diesen Primaruntersuchungen identifizierten, fur die entsprechenden Sonden 
- positiven Phagenklone wurden aufgereinigt. Der Phagenklon PI 7 wurde mit einem 
etwa 250 bp langen hTC-cDNA Fragment (Position 1787 bis 2040 der Fig. 6) 
5 gefunden. Der Phagenklon P2 wurde mit einem etwa 740 bp langen hTC-cDNA 
Fragment (Position 1685 bis 2349 plus 2531 bis 2607 der Fig. 6 [Deletion 2; vergl. 
Beispiel 5]) identifiziert. Die Phagenklone P3 und P5 wurden mit einem 420 bp 
langen 3' hTC-cDNA Fragment (Position 3047 bis 3470 der Fig. 6) gefunden. Nach 
A.-DNA Preparation dieser Phagen und nachfolgendem Restriktionsverdau mit 
10 Enzymen, die das genomische Insert in Fragmenten freisetzen, wurden die Inserts in 
Plasmide umkloniert (Beispiel 4). 

Beispiel 3 

15 Urn zu untersuchen, ob auch das 5'-Ende der hTC-cDNA im Insert des rekombinan- 
ten Phagenklons PI 2 vorliegt, wurde A.-DNA dieses Klons in einer Southern Blot 
Analyse mit einem radioaktiv markierten etwa 440 bp langen hTC-cDNA Fragment 
(Position 1 bis 440 der Fig. 6) aus dem extremen 5'-Bereich hybridisiert (Fig. 3). 

20 Da die isolierte X-DNA des positiven Klons auch mit dem extremen 5'-Ende der 
hTC-cDNA hybridisiert, enthalt dieser Phage wahrscheinlich auch den das ATG- 
Startcodon flankierenden 5'-Sequenzbereich.. 

Beispiel 4 

25 

Um das gesamte 15 kb lange Insert des positiven Phagenklons P12 in Teilfragmenten 
umzuklonieren und anschlieBend zu sequenzieren, wurden zum DNA-Verdau 
Restriktionsendonukleasen ausgewahlt, die zum einem das gesamte Insert aus 
EMBL3 Sp6/T7 freisetzen (vgl. Beispiel 2) und zusatzlich im Insert schneiden. 
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Insgesamt wurden ein etwa 8,3 und ein etwa 6,5 kb langes Xho I-Subfragment sowie 
ein etwa 8,5, ein etwa 3,5 und ein etwa 3 kb langes Sac I-Teilfragment in den Vektor 
pBluescript KS(+) (Fa. Stratagene) umkloniert. Durch Sequenzanalyse dieser 
Fragmente wurde die Nukleotidsequenz von 5123 bp 5'-flankierenden des ghTC- 
Genbereichs, ausgehend vom ATG-Startcodon bestimmt (Fig. 4; entsprechend 
SEQ ID NO 1). In der Fig. 4 sind die ersten (ausgehend vom ATG-Startcodon) 5123 
bp dargestellt. In der Fig. 10 (entsprechend SEQ ID NO 3) die gesamte klonierte 5' 
Sequenz. 

Um das gesamte ca. 14,6 kb groBe Insert des Phagenklons PI 7 in Teilfragmenten 
umzuklonieren, wurden zum DNA-Verdau Restriktionsendonukleasen ausgewahlt, 
die zum einen das gesamte Insert aus EMLB3 Sp6/T7 freisetzen und zusatzlich 
einige Male im Insert schneiden. Durch Kombinationsverdau mit den Enzymen Xhol 
und BamHI wurden ein 7,1 kb, ein 4,2 kb und ein 1,5 kb groBes XhoI-BamHI- 
Fragment sowie ein 1,8 kb groBes BamHI-Fragment subkloniert. Der Kombinations- 
Restriktionsverdau mit den Enzymen Xhol und Xbal fiihrte zur Klonierung von 
einem 6,5 kb groBen Xhol-Xbal-Fragment, einem 6,5 kb und einem l£ kb grofiem 
Xhol-Fragment. 

Die Umklonierung des ca. 17,9 kb groBem Inserts des Phagenklons P2 in 
Subfragmente erfolgte durch Verdau mit dem Restriktionsenzym Xhol. Insgesamt 
wurde ein 7,5 kb, ein 6,4 kb sowie ein 1,6 kb langes Xhol-Subfragment kloniert. 
Durch Verdau mit dem Restriktionsenzym Sad wurde zusatzlich ein 4,8 kb, ein 3 kb, 
ein 2 kb sowie ein 1 ,8 kb groBes Sacl-Fragment subkloniert. 

Das ca. 13,5 kb groBe Insert des Phagenklons P3 wurde durch Verdau mit den 
Restriktionsenzymen Sad bzw.XhoI subkloniert. Dabei wurden ein 3,2 kb, ein 2 kb, 
ein 0,9 kb, ein 0,8 kb, ein 0,65 kb und ein 0,5 kb langes Sacl-Subfragment sowie ein 
6,5 kb und ein 4,3 kb langes Xhol-Subfragment erhalten. 
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Die Subklonierung des ca. 13,2 kb groBen Inserts des Phagenklons P5 erfolgte durch 
Verdau rait den Restriktionsenzymen Sad bzw. Xhol. Insgesamt wurden SacI- 
Fragmente von 6,5 kb, 3,3 kb, 3,2 kb, 0,8 kb und 0,3 kb GroBe sowie Xhol- 
Fragmente von 7 kb und 3,2 kb GroBe subkloniert. 

Zur Klonierung des 3* von Phagenklon PI 7 und 5 4 von Phagenklon P2 gelegenen 
hTC-genomischen Sequenzbereichs wurden 3 Genomic Walkings mit Hilfe des 
Genome Walker™ Kits der Firma Clontech (Katalognummer Kl 803-1) und ver- 
schiedenen Primerkombinationen durchgefuhrt. In einem Endvolumen von 50 ^il 
wurde 1 jil humaner Genome Walker Library HDL (Fa. Clontech) mit lOpmol 
dNTP-Mix versetzt und in IxKlen Taq PCR-Reaktionspuffer und lx Advantage Klen 
Taq Polymerase Mix (Fa. Clontech) eine PCR-Reaktion durchgefuhrt. Als Primer 
wurden 10 pmol eines internen genspezifischen Primers sowie 10 pmol des Adaptor 
Primers API (5 '-GTAATACG ACTC ACTATAGGGC-3 4 ; Fa. Clontech) zugefugt. 
Die PCR wurde als Touchdown-PCR in 3 Schritten durchgefuhrt. Zunachst wurde 
uber 7 Zyklen fiir 20 sec bei 94°C denaturiert und anschlieBend fur 4 min bei 72°C 
die Primer angelagert und die DNA-Kette verlangert. Es folgten 37 Zyklen bei denen 
fiir 20 sec die DNA bei 94°C denaturiert wurde, die anschlieBende Primerver- 
langerung aber fur 4 min bei 67°C erfolgte. AbschlieBend folgte eine Kettenver- 
langerung fur 4 min bei 67°C. Im AnschluB an diese erste PCR wurde das PCR- 
Produkt 1 :50 verdunnt. Ein |il dieser Verdiinnung wurde in einer zweiten „nested" 
PCR zusammen mit 10 pmol dNTP-Mix in IxKlen Taq PCR-Reaktionspuffer und 
1 xAdvantage Klen Taq Polymerase-Mix sowie 1 0 pmol eines „nested" gen- 
spezifischen Primers und 10 pmol des „nested :t Marathon Adaptor Primers AP2 (5'- 
ACTATAGGGCACGCGTGGT-3 Fa. Clontech) eingesetzt. Die PCR-Bedingungen 
entsprachen den in der ersten PCR gewahlten Parametern. Als einzige Ausnahme 
wurden im ersten PCR-Schritt statt 7 Zyklen nur 5 Zyklen gewahlt und im zweiten 
PCR-Schritt statt 37 Zyklen nur 24 Zyklen durchlaufen. Produkte dieser Nested- . 
Genomic Walking-PCR wurden in den TA-Cloning Vektor pCRII der Fa. InVitrogen 
kloniert. 
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Im ersten Genomic Walking wurde der genspezifische Primer C3K2-GSP1 (5'- 
GACGTGGCTCTTGAAGGCCTTG-3') sowie der „nested" genspezifische Primer 
C3K2-GSP2 (S'-GCCTTCTGGACCACGGCATACCO 4 ) zusammen mit der HDL- 
Library 4 eingesetzt und ein 1639 bp langes PCR-Fragment erhalten. Im zweiten 
5 Genomic Walking wurde mit dem genspezifischen Primer C3F2 (5 5 - 
CGTAGTTGAGC ACGCTG AACAGTG-3 ') und dem „nested ;t genspezifischen 
Primer C3F (5 '-CCTTC ACCCTCG AGGTGAGACGCT-3 4 ) aus der HDL-Library 4 
ein PCR-Fragment von 685 bp Lange amplifiziert. Der dritte Genomic Walking 
Ansatz fuhrte unter Einsatz des genspezifischen Primers DEL5-GSP1 (5'- 
1 0 GGTGG ATGTG ACGGGCGCGTACG-3 ' ) und des „nested ;i genspezifischen 
Primers C5K-GSPI (5 4 -GGTATGCCGTGGTCC AG A AGGC-3 1 ) zur Klonierung 
eines 924 bp PCR-Fragments aus der HDL-Library 1 . Insgesamt vvurden durch dieses 
Genomic Walking- Verfahren 2100 bp der 3 £ von Phagenklon PI 7 gelegenen 
genomischen hTC-Region identifiziert (s. Fig. 7). 

15 

Die subklonierten Fragmente sowie die Genomic Walking-Produkte wurden ein- 
zelstrangig sequenziert. Unter Verwendung der Lasergene Biocomputing Software 
(DNASTAR Inc. Madison, Wisconsin, USA) wurden iiberlappende Bereiche 
identifiziert und Contigs gebildet. Insgesamt wurden aus den gesammelten 

20 Sequenzen der Phagenklone PI 2, PI 7, P2, P3 und P5 sowie den Sequenzdaten aus 
dem Genomic Walking 2 groBe Contigs zusammengestellt. Contig 1 besteht aus 
Sequenzdaten von Phagenklon PI 2, PI 7 und den Sequenzdaten aus dem Genomic 
Walking. Contig 2 wurde aus den Sequenzen von Phagenklon P2, P3 und P5 
zusammengesetzt. Uberlappende Phagenklonbereiche sind in Fig. 7 schematisch 

25 dargestellt. Die Sequenzdaten der 2 Contigs sind nachfolgend dargestellt. Das ATG 
Startcodon in Contig 1 ist unterstrichen. Das TGA Stopcodon ist in Contig 2 
unterstrichen. 
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Contigl: 



ACTTGAGCCC AAGAGTTCAA GGCTACGGTG AGCCATGATT GCAACACCAC ACGCCAGCCT TGGTGACAGA 70 
ATGAGACCCT GTCTCAAAAA AAAAAAAAAA AATTGAAATA ATATAAAGCA TCTTCTCTGG CCACAGTGGA 140 
ACAAAACCAG AAATCAACAA CAAGAGGAAT TTTGAAAACT ATACAAACAC ATGAAAATTA AACAATATAC 210 
TTCTGAATGA CCAGTGAGTC AATGAAGAAA TTAAAAAGGA AATTGAAAAA TTTATTTAAG CAAATGATAA 280 
CGGAAACATA ACCTCTCAAA ACCCACGGTA TACAGCAAAA GCAGTGCTAA GAAGGAAGTT TATAGCTATA 350 
AGCAGCTACA TCAAAAAAGT AGAAAAGCCA GGCGCAGTGG CTCATGCCTG TAATCCCAGC ACTTTGGGAG 420 
GCCAAGGCGG GCAGATCGCC TGAGGTCAGG AGTTCGAGAC CAGCCTGACC AACACAGAGA AACCTTGTCG 490 
CTACTAAAAA TACAAAATTA GCTGGGCATG GTGGCACATG CCTGTAATCC CAGCTACTCG GGAGGCTGAG 560 
GCAGGATAAC CGCTTGAACC CAGGAGGTGG AGGTTGCGGT GAGCCGGGAT TGCGCCATTG GACTCCAGCC 630 
TGGGTAACAA GAGTGAAACC CTGTCTCAAG AAAAAAAAAA AAGTAGAAAA ACTTAAAAAT ACAACCTAAT 700 
GATGCACCTT AAAGAACTAG AAAAGCAAGA GCAAACTAAA CCTAAAATTG GTAAAAGAAA AGAAATAATA 770 
AAGATCAGAG CAGAAATAAA TGAAACTGAA AGATAACAAT ACAAAAGATC AACAAAATTA AAAGTTGGTT 840 
TTTTGAAAAG ATAAACAAAA TTGACAAACC TTTGCCCAGA CTAAGAAAAA AGGAAAGAAG ACCTAAATAA 910 
ATAAAGTCAG AGATGAAAAA AGAGACATTA CAACTGATAC CACAGAAATT CAAAGGATCA CTAGAGGCTA 980 
CTATGAGCAA CTGTACACTA ATAAATTGAA AAACCTAGAA AAAATAGATA AATTCCTAGA TGCATACAAC 1050 
CTACCAAGAT TGAACCATGA AGAAATCCAA AGCCCAAACA GACCAATAAC AATAATGGGA TTAAAGCCAT 1120 
AATAAAAAGT CTCCTAGCAA AGAGAAGCCC AGGACCCAAT GGCTTCCCTG CTGGATTTTA CCAATCATTT 1190 
AAAGAAGAAT GAATTCCAAT CCTACTCAAA CTATTCTGAA AAATAGAGGA AAGAATACTT CCAAACTCAT 1260 
TCTACATGGC CAGTATTACC CTGATTCCAA AACCAGACAA AAACACATCA AAAACAAACA AACAAAAAAA 1330 
CAGAAAGAAA GAAAACTACA GGCCAATATC CCTGATGAAT ACTGATACAA AAATCCTCAA CAAAACACTA 1400 
GCAAACCAAA TTAAACAACA CCTTCGAAAG AT C ATT CAT T GTGATCAAGT GGGATTTATT CCAGGGATGG 1470 
AAGGATGGTT CAACATATGC AAATCAATCA ATGTGATACA TCATCCCAAC AAAATGAAGT ACAAAAACTA 1540 
TATGATTATT TCACTTTATG CAGAAAAAGC ATT T GAT AAA ATTCTGCACC CTTCATGATA AAAACCCTCA 1610 
AAAAACCAGG TATACAAGAA ACATACAGGC CAGGCACAGT GGCTCACACC TGCGATCCCA GCACTCTGGG 1680 
AGGCCAAGGT GGGATGATTG CTTGGGCCCA GGAGTTTGAG ACTAGCCTGG GCAACAAAAT GAGACCTGGT 17 50 
CTACAAAAAA CTTTTTTAAA AAATTAGCCA GGCATGATGG CATATGCCTG TAGTCCCAGC TAGTCTGGAG 1820 
GCTGAGGTGG GAGAATCACT TAAGCCTAGG AGGTCGAGGC TGCAGTGAGC CATGAACATG TCACTGTACT 1890 
CCAGCCTAGA CAACAGAACA AGACCCCACT GAATAAGAAG AAGGAGAAGG AGAAGGGAGA AGGGAGGGAG 1960 
AAGGGAGGAG GAGGAGAAGG AGGAGGTGGA GGAGAAGTGG AAGGGGAAGG GGAAGGGAAA GAGGAAGAAG 2030 
AAGAAACATA TTTCAACATA ATAAAAGCCC TATATGACAG ACCGAGGTAG TATTATGAGG AAAAACTGAA 2100 
AGCCTTTCCT CTAAGATCTG GAAAATGACA AGGGCCCACT TTCACCACTG TGATTCAACA TAGTACTAGA 2170 
AGTCCTAGCT AGAGCAATCA GATAAGAGAA AGAAATAAAA GGCATCCAAA CTGGAAAGGA AGAAGTCAAA 2240 
TTATCCTGTT TGCAGATGAT ATGATCTTAT ATCTGGAAAA GACTTAAGAC ACCACTAAAA AACTATTAGA 2310 
GCTGAAATTT GGTACAGCAG GATACAAAAT CAATGTACAA AAATCAGTAG TATTTCTATA TTCCAACAGC 2380 
AAACAATCTG AAAAAGAAAC CAAAAAAGCA GCTACAAATA AAATTAAACA GCTAGGAATT AACCAAAGAA 2450 
GTGAAAGATC TCTACAATGA AAACTATAAA ATGTTGATAA AAGAAATTGA AGAGGGCACA AAAAAAGAAA 2520 
AGATATTCCA TGTTCATAGA TTGGAAGAAT AAATACTGTT AAAATGTCCA TACTACCCAA AGCAATTTAC 2590 
AAATTCAATG CAATCCCTAT TAAAATACTA ATGACGTTCT TCACAGAAAT AGAAGAAACA ATTCTAAGAT 2660 
TTGTACAGAA CCACAAAAGA CCCAGAATAG CCAAAGCTAT CCTGACCAAA AAGAACAAAA CTGGAAGCAT 2730 
CACATTACCT GACTTCAAAT TAT ACT AC AA AGCTATAGTA ACCCAAACTA CATGGTACTG GC ATAAAAAC 2800 
AGATGAGACA TGGACCAGAG GAACAGAATA GAGAATCCAG AAACAAATCC ATGCATCTAC AGTGAACTCA 2870 
TTTTTGACAA AGGTGCCAAG AACATACTTT GGGGAAAAGA TAATCTCTTC AATAAATGGT GCTGGAGGAA 2940 
CTGGATATCC ATATGCAAAA TAACAATACT AGAACTCTGT CTCTCACCAT ATACAAAAGC AAATCAAAAT 3010 
GGATGAAAGG CTTAAATCTA AAACCTCAAA CTTTGCAACT ACTAAAAGAA AACACCGGAG AAACTCTCCA 3080 
GGACATTGGA GTGGGCAAAG ACTTCTTGAG TAATTCCCTG CAGGCACAGG CAACCAAAGC AAAAACAGAC 3150 
AAATGGGATC ATATCAAGTT AAAAAGCTTC TGCCCAGCAA AGGAAACAAT CAACAAAGAG AAGAGACAAC 3220 
CCACAGAATG GGAGAATATA TTTGCAAACT ATTCATCTAA CAAGGAATTA ATAACCAGTA TATATAAGGA 3290 
GCTCAAACTA CTCTATAAGA AAAACACCTA ATAAGCTGAT TTTCAAAAAT AAGCAAAAGA TCTGGGTAGA 3360 
CATTTCTCAA AATAAGTCAT ACAAATGGCA AACAGGCATC TGAAAATGTG CTCAACACCA CTGATCATCA 3430 
GAGAAATGCA AATCAAAACT ACTATGAGAG ATCATCTCAT CCCAGTTAAA ATGGCTTTTA TTCAAAAGAC 3500 
AGGCAATAAC AAATGCCAGT GAGGATGTGG ATAAAAGGAA ACCCTTGGAC ACTGTTGGTG GGAATGGAAA 3570 
TTGCTACCAC TATGGAGAAC AGTTTGAAAG TTCCTCAAAA AACTAAAAAT AAAGCTACCA TACAGCAATC 3640 
CCATTGCTAG GTATATACTC CAAAAAAGGG AATCAGTGTA TCAACAAGCT ATCTCCACTC CCACATTTAC 3710 
TGCAGCACTG TTCATAGCAG CCAAGGTTTG GAAGCAACCT CAGTGTCCAT CAACAGACGA ATGGAAAAAG 3780 
AAAATGTGGT GC AC AT AC AC AATGGAGTAC TACGCAGCCA TAAAAAAGAA TGAGATCCTG TCAGTTGCAA 3850 
CAGCATGGGG GGCACTGGTC AGTATGTTAA GTGAAATAAG CCAGGCACAG AAAGACAAAC TTTTCATGTT 3920 
CTCCCTTACT .TGTGGGAGCA AAAATTAAAA CAATTGACAT AGAAATAGAG GAGAATGGTG GTTCTAGAGG 3990 
GGTGGGGGAC AGGGTGACTA GAGTCAACAA TAATTTATTG TATGTTTTAA AATAACTAAA AGAGTATAAT 4060 
TGGGTTGTTT GTAACACAAA GAAAGGATAA ATGCTTGAAG GTGACAGATA CCCCATTTAC CCTGATGTGA 4130 
TT ATT AC AC A TTGTATGCCT GTATCAAAAT ATCTCATGTA TGCTATAGAT ATAAACCCTA CTATATTAAA 4200 
AATTAAAATT TTAATGGCCA GGCACGGTGG CTCATGTCCG TAATCCCAGC ACTTTGGGAG GCCGAGGCGG 4270 
GTGGATCACC TGAGGTCAGG AGTTTGAAAC CAGTCTGGCC ACCATGATGA AACCCTGTCT CTACTAAAGA 4340 
TACAAAAATT AGCCAGGCGT GGTGGCACAT ACCTGTAGTC CCAACTACTC AGGAGGCTGA GACAGGAGAA 4 410 
TTGCTTGAAC CTGGGAGGCG GAGGTTGCAG TGAGCCGAGA TCATGCCACT GCACTGCAGC CTGGGTGACA 4 480 
GAGCAAGACT CCATCTCAAA ACAAAAACAA AAAAAAGAAG ATTAAAATTG TAATTTTTAT GTACCGTATA 4550 
AATATATACT C TACT AT ATT AGAAGTTAAA AATTAAAACA ATTATAAAAG GTAATTAACC ACTTAATCTA 4 620 
AAATAAGAAC AATGTATGTG GGGTTTCTAG CTTCTGAAGA AGTAAAAGTT ATGGCCACGA TGGCAGAAAT 4690 
GTGAGGAGGG AACAGTGGAA GTTACTGTTG TTAGACGCTC ATACTCTCTG TAAGTGACTT AATTTTAACC 4760 
AAAGACAGGC TGGGAGAAGT TAAAGAGGCA TTCTATAAGC CCTAAAACAA CTGCTAATAA TGGTGAAAGG 4830 
TAATCTCTAT TAATTACCAA TAATTACAGA TATCTCTAAA ATCGAGCTGC AGAATTGGCA CGTCTGATCA 4900 
CACCGTCCTC TCATTCACGG TGCTTTTTTT CTTGTGTGCT TGGAGATTTT CGATTGTGTG TTCGTGTTTG 4 970 
GTTAAACTTA ATCTGTATGA ATCCTGAAAC GAAAAATGGT GGTGATTTCC TCCAGAAGAA TTAGAGTACC 5040 
TGGCAGGAAG .CAGGTGGCTC TGTGGACCTG AGCCACTTCA ATCTTCAAGG GTCTCTGGCC AAGACCCAGG 5110 
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TGCAAGGCAG AGGCCTGATG ACCCGAGGAC AGGAAAGCTC GGATGGGAAG GGGCGATGAG AAGCCTGCCT 5180 
CGTTGGTGAG CAGCGCATGA AGTGCCCTTA TTTACGCTTT GCAAAGATTG CTCTGGATAC CATCTGGAAA 5250 
AGGCGGCCAG CGGGAATGCA AGGAGTCAGA AGCCTCCTGC TCAAACCCAG GCCAGCAGCT ATGGCGCCCA 5320 
CCCGGGCGTG TGCCAGAGGG AGAGGAGTCA AGGCACCTCG AAGTATGGCT TAAATCTTTT TTTCACCTGA 5390 
AGCAGTGACC AAGGTGTATT CTGAGGGAAG CTTGAGTTAG GTGCCTTCTT TAAAACAGAA AGTCATGGAA 5460 
GCACCCTTCT CAAGGGAAAA CCAGACGCCC GCTCTGCGGT CATTTACCTC TTTCCTCTCT CCCTCTCTTG 5530 
CCCTCGCGGT TTCTGATCGG GACAGAGTGA CCCCCGTGGA GCTTCTCCGA GCCCGTGCTG AGGACCCTCT 5600 
TGCAAAGGGC TCCACAGACC CCCGCCCTGG AGAGAGGAGT CTGAGCCTGG CTTAATAACA AACTGGGATG 5670 
TGGCTGGGGG CGGACAGCGA CGGCGGGATT CAAAGACTTA ATTCCATGAG TAAATTCAAC CTTTCCACAT 5740 
CCGAATGGAT TTGGATTTTA TCTTAATATT TTCTTAAATT TCATCAAATA ACATTCAGGA CTGCAGAAAT 5810 
CCAAAGGCGT AAAACAGGAA CTGAGiCTATG TTTGCCAAGG TCCAAGGACT TAATAACCAT GTTCAGAGGG 5880 
ATTTTTCGCC CTAAGTACTT TTTATTGGTT TTCATAAGGT GGCTTAGGGT GCAAGGGAAA GTACACGAGG 5950 
AGAGGCCTGG GCGGCAGGGC TATGAGCACG GCAGGGCCAC CGGGGAGAGA GTCCCCGGCC TGGGAGGCTG 6020 
ACAGCAGGAC CACTGACCGT CCTCCCTGGG AGCTGCCACA TTGGGCAACG CGAAGGCGGC CACGCTGCGT 6090 
GTGACTCAGG ACCCCATACC GGCTTCCTGG GCCCACCCAC ACTAACCCAG GAAGTCACGG AGCTCTGAAC 6160 
CCGTGGAAAC GAACATGACC CTTGCCTGCC TGCTTCCCTG GGTGGGTCAA GGGTAATGAA GTGGTGTGCA 6230 
GGAAATGGCC ATGTAAATTA CACGACTCTG CTGATGGGGA CCGTTCCTTC CATCATTATT CATCTTCACC 6300 
CCCAAGGACT GAATGATTCC AGCAACTTCT TCGGGTGTGA CAAGCCATGA CAAAACTCAG TACAAACACC 6370 
ACTCTTTTAC TAGGCCCACA GAGCACGGSC CACACCCCTG ATATATTAAG AGTCCAGGAG AGATGAGGCT 6440 
GCTTTCAGCC ACCAGGCTGG GGTGACAACA GCGGCTGAAC AGTCTGTTCC TC TAG ACT AG TAGACCCTGG 6510 
CAGGCACTCC CCCAGATTCT. AGGGCCTGGT TGCTGCTTCC CGAGGGCGCC ATCTGCCCTG GAGACTCAGC 6580 
CTGGGGTGCC ACACTGAGGC CAGCCCTGTC TCCACACCCT CCGCCTCCAG GCCTCAGCTT CTCCAGCAGC 6650 
TTCCTAAACC CTGGGTGGGC CGTGTTCCAG CGCTACTGTC TCACCTGTCC CACTGTGTCT TGTCTCAGCG 6720 
ACGTAGCTCG CACGGTTCCT CCTCACATGG GGTGTCTGTC TCCTTCCCCA ACACTCACAT GCGTTGAAGG 6790 
GAGGAGATTC TGCGCCTCCC AGACTGGCTC CTCTGAGCCT GAACCTGGCT CGTGGCCCCC GATGCAGGTT 6860 
CCTGGCGTCC GGCTGCACGC TGACCTCCAT TTCCAGGCGC TCCCCGTCTC CTGTCATCTG CCGGGGCCTG 6930 
CCGGTGTGTT CTTCTGTTTC TGTGCTCCTT TCCACGTCCA GCTGCGTGTG TCTCTGCCCG CTAGGGTCTC 7000 
GGGGTTTTTA TAGGCATAGG ACGGGGGCGT GGTGGGCCAG GGCGCTCTTG GGAAATGCAA CATTTGGGTG 7070 
TGAAAGTAGG AGTGCCTGTC CTCACCTAGG TCCACGGGCA CAGGCCTGGG G.VTGGAGCCC CCGCCAGGGA 7140 
CCCGCCCTTC TCTGCCCAGC ACTTTCCTGC CCCCCTCCCT CTGGAACACA GAGTGGCAGT TTCCACAAGC 7210 
ACTAAGCATC CTCTTCCCAA AAGACCCAGC ATTGGCACCC .CTGGACATTT GCCCCACAGC CCTGGGAATT 7280 
CACGTGACTA CGCACATCAT GTACACACTC CCGTCCACGA CCGACCCCCG CTGTTTTATT TTAATAGCTA 7350 
CAAAGCAGGG AAATCCCTGC TAAAATGTCC TTTAACAAAC TGGTTAAACA AACGGGTCCA TCCGCACGGT 7420 
GGACAGTTCC TCACAGTGAA GAGGAACATG CCGTTTATAA AGCCTGCAGG CATCTCAAGG GAATTACGCT 7490 
GAGTCAAAAC TGCCACCTCC ATGGGATACG TACGCAACAT GCTCAAAAAG AAAGAATTTC ACCCCATGGC 7560 
AGGGGAGTGG TTAGGGGGGT TAAGGACGGT GGGGGCGGCA GCTGGGGGCT ACTGCACGCA CCTTTTACTA 7630 
AAGCCAGTTT CCTGGTTCTG ATGGTATTGG CTCAGTTATG GGAGACTAAC CATAGGGGAG TGGGGATGGG 7700 
GGAACCCGGA GGCTGTGCCA TCTTTGCCAT GCCCGAGTGT CCTGGGCAGG ATAATGCTCT AGAGATGCCC 7770 
ACGTCCTGAT TCCCCCAAAC, CTGTGGACAG AACCCGCCCG GCCCCAGGGC CTTTGCAGGT GTGATCTCCG 7840 
TGAGGACCCT GAGGTCTGGG ATCCTTCGGG ACTACCTGCA GGCCCGAAAA GTAATCCAGG GGTTCTGGGA 7910 
AGAGGCGGGC AGGAGGGTCA GAGGGGGGCA GCCTCAGGAC GATGGAGGCA GTCAGTCTGA GGCTGAAAAG 7980 
GGAGGGAGGG CCTCGAGCCC AGGCCTGCAA GCGCCTCCAG AAGCTGGAAA AAGCGGGGAA GGGACCCTCC 8050 
ACGGAGCCTG CAGCAGGAAG GCACGGCTGG CCCTTAGCCC ACCAGGGCCC ATCGTGGACC TCCGGCCTCC 8120 
GTGCCATAGG AGGGCACTCG CGCTGCCCTT CTAGCATGAA GTGTGTGGGG ATTTGCAGAA GCAACAGGAA 8190 
ACCCATGCAC TGTGAATCTA GGATTATTTC AAAACAAAGG TTTACAGAAA CATCCAAGGA CAGGGCTGAA 8260 
GTGCCTCCGG GCAAGGGCAG GGCAGGCACG AGTGATTTTA TTTAGCTATT TTATTTTATT TACTTACTTT 8330 
CTGAGACAGA GTTATGCTCT TGTTGCCCAG GCTGGAGTGC AGCGGCATGA TCTTGGCTCA CTGCAACCTC 8400 
CGTCTCCTGG GTTCAAGCAA TTCTCGTGCC TCAGCCTCCC AAGTAGCTGG GATTTCAGGC GTGCACCACC 8470 
ACACCCGGCT AATTTTGTAT TTTTAGTAGA GATGGGCTTT CACCATGTTG GTCAAGCTGA TCTCAAAATC 8540 
CTGACCTCAG GTGATCCGCC CACCTCAGCC TCCCAAAGTG CTGGGATTAC AGGCATGAGC CACTGCACCT 8610 
GGCCTATTTA ACCATTTTAA AACTTCCCTG GGCTCAAGTC ACACCCACTG GTAAGGAGTT CATGGAGTTC 8680 
AATTTCCCCT TTACTCAGGA GTTACCCTCC TTTGATATTT TCTGTAATTC TTCGTAGACT GGGGATACAC 8750 
CGTCTCTTGA CATATTCACA GTTTCTGTGA CCACCTGTTA TCCCATGGGA CCCACTGCAG GGGCAGCTGG 8820 
GAGGCTGCAG GCTTCAGGTC CCAGTGGGGT TGCCATCTGC CAGTAGAAAC CTGATGTAGA ATCAGGGCGC 8890 
AAGTGTGGAC ACTGTCCTGA ATCTCAATGT CTCAGTGTGT GCTGAAACAT GTAGAAATTA' AAGTCCATCC 8960 
CTCCTACTCT ACTGGGATTG AGCCCCTTCC CTATCCCCCC CCAGGGGCAG AGGAGTTCCT CTCACTCCTG 9030 
TGGAGGAAGG AATGATACTT TGTTATTTTT CACTGCTGGT ACTGAATCCA CTGTTTCATT TGTTGGTTTG 9100 
TTTGTTTTGT TTTGAGAGGC GGTTTCACTC TTGTTGCTCA GGCTGGAGGG AGTGCAATGG CGCGATCTTG 9170 
GCTTACTGCA GCCTCTGCCT CCCAGGTTCA AGTGATTCTC CTGCTTCCGC CTCCCATTTG GCTGGGATTA 9240 
CAGGCACCCG CCACCATGCC CAGCTAATTT TTTGTATTTT TAGTAGAGAC GSGGGTGGGT GGGGTTCACC 9310 
ATGTTGGCCA GGCTGGTCTC GAACTTCTGA CCTCAGATGA TCCACCTGCC TCTGCCTCCT AAAGTGCTGG 9380 
GATTACAGGT GTGAGCCACC ATGCCCAGCT CAGAATTTAC TCTGTTTAGA AACATCTGGG TCTGAGGTAG 9450 
GAAGCTCACC CCACTCAAGT GTTGTGGTGT TTTAAGCCAA TGATAGAATT TTTTTATTGT TGTTAGAACA 9520 
CTCTTGATGT TTTACACTGT GATGACTAAG ACATCATCAG CTTTTCAAAG ACACACTAAC TGCACCCATA 9590 
ATACTGGGGT GTCTTCTGGG TATCAGCAAT CTTCATTGAA TGCCGGGAGG CGTTTCCTCG CCATGCACAT 9660 
GGTGTTAATT ACTCCAGCAT AATCTTCTGC TTCCATTTCT TCTCTTCCCT CTTTTAAAAT TGTGTTTTCT 9730 
ATGTTGGCTT CTCTGCAGAG AACCAGTGTA AGCTACAACT TAACTTTTGT TGGAACAAAT f TTCCAAACC 9800 
GCCCCTTTGC CCTAGTGGCA GAGACAATTC ACAAACACAG CCCTTTAAAA AGGCTTAGGG ATCACTAAGG 9870 
GGATTTCTAG AAGAGCGACC TGTAATCCTA AGTATTTACA AGACGAGGCT AACCTCCAGC GAGCGTGACA 9940 
GCCCAGGGAG GGTGCGAGGC CTGTTCAAAT GCTAGCTCCA TAAATAAAGC AATTTCCTCC GGCAGTTTCT 10010 
GAAAGTAGGA AAGGTTACAT TTAAGGTTGC GTTTGTTAGC ATTTCAGTGT TTGCCGACCT CAGCTACAGC 10080 
ATCCCTGCAA GGCCTCGGGA GACCCAGAAG TTTCTCGCCC CCTTAGATCC AAACTTGAGC AACCCGGAGT 10150 
CTGGATTCCT GGGAAGTCCT CAGCTGTCCT GCGGTTGTGC CGGGGCCCCA GGTCTGGAGG GGACCAGTGG 10220 
CCGTGTGGCT TCTACTGCTG GGCTGGAAGT CGGGCCTCCT AGCTCTGCAG TCCGAGGCTT GGAGCCAGGT 10290 
GCCTGGACCC CGAGGCTGCC CTCCACCCTG TGCGGGCGGG ATGTGACCAG ATGTTGGCCT CATCTGCCAG 10360 
ACAGAGTGCC GGGGCCCAGG GTCAAGGCCG TTGTGGCTGG TGTGAGGCGC CCGGTGCGCG GCCAGCAGGA 104 30 
GCGCCTGGCT CCATTTCCCA CCCTTTCTCG ACGGGACCGC CCCGGTGGGT GATTAACAGA TTTGGGGTGG 10500 
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TTTGCTCATG GTGGGGACCC CTCGCCGCCT GAGAACCTGC 
CCCAAGTCGC GGGGAAGTGT TGCAGGGAGG CACTCCGGGA 
GTCCTCGGGT TCGTCCCCAG CCGCGTCTAC GCGCCTCCGT 
CCGGAGCCCG ACGCCCCGCG TCCGGACCTG GAGGCAGCCC 
GGTCGCCGCA CGCACCTGTT CCCAGGGCCT CCACATCATG 
GCCGATTCGA CCTCTCTCCG CTGGGGCCCT CGCTGGCGTC 
GGCGGGGAAG CGCGGCCCAG ACCCCCGGGT CCGCCCGGAG 
CCAGTGGATT CGCGGGCACA GACGCCCAGG ACCGCGCTCC 
ACCCGTCCTG CCCCTTCACC TTCCAGCTCC GCCTCCTCCG 
GGGTCCCCGG CCCAGCCCCC TCCGGGCCCT CCCAGCCCCT 
TCGCGGCGCG AGTTTCAGGC AGCGCTGCGT CCTGCTGCGC 
GCGATGCCGC GCGCTCCCCG CTGCCGAGCC GTGCGCTCCC 
CGCTGGCCAC GTTCGTGCGG CGCCTGGGGC CCCAGGGCTG 
TTTCCGCGCG CTGGTGGCCC AGTGCCTGGT GTGCGTGCCC 
TCCTTCCGCC AGGTGGGCCT CCCCGGGGTC GGCGTCCGGC 
GACATGCGGA GAGCAGCGCA GGCGACTCAG GGCGCTTCCC 
GCCCGAGTGC TGCAGAGGCT GTGCGAGCGC GGCGCGAAGA 
ACGGGGCCCG CGGGGGCCCC CCCGAGGCCT TCACCACCAG 
CGACGCACTG CGGGGGAGCG GGGCGTGGGG GCTGCTGCTG 
CTGCTGGCAC GCTGCGCGCT CTTTGTGCTG GTGGCTCCCA 
TGTACCAGCT CGGCGCTGCC ACTCAGGCCC GGCCCCCGCC 
ATGCGAACGG GCCTGGAACC ATAGCGTCAG GGAGGCCGGG 
AGGAGGCGCG GGGGCAGTGC CAGCCGAAGT CTGCCGTTGC 
AGCCGGAGCG GACGCCCGTT GGGCAGGGGT CCTGGGCCCA 
TGGTTTCTGT GTGGTGTCAC CTGCCAGACC CGCCGAAGAA 
ACGCGCCACT CCCACCCATC CGTGGGCCGC CAGCACCACG 
GTCCCTGGGA CACGCCTTGT CCCCCGGTGT ACGCCGAGAC 
GGAGCAGCTG CGGCCCTCCT TCCTACTCAG CTCTCTGAGG 
GAGACCATCT TTCTGGGTTC CAGGCCCTGG ATGCCAGGGA 
GCTACTGGCA AATGCGGCCC CTGTTTCTGG AGCTGCTTGG 
CCTCAAGACG CACTGCCCGC TGCGAGCTGC GGTCACCCCA 
CAGGGCTCTG TGGCGGCCCC CGAGGAGGAG GACACAGACC 
ACAGCAGCCC CTGGCAGGTG TACGGCTTCG TGCGGGCCTG 
GGGCTCCAGG CACAACGAAC GCCGCTTCCT CAGGAACACC 
AAGCTCTCGC TGCAGGAGCT GACGTGGAAG ATGAGCGTGC 
GTGAGGAGGT GGTGGCCGTC GAGGGCCCAG GCCCCAGAGC 
AGGCAGAGCC CTGGTCCTCC TGTCTCCATC GTCACGTGGG 
TGGACACGGT GATCTCTGCC TCTGCTCTCC CTCCTGTCCA 
CGTTTTGATG GACACGCGGT TTCCAGGCGC CGAGGCCAGA 
TGGAGCCGGG TTGCCGGCAA TGGGGAGAAG TGTCTGGAAG 
TTACCTATAA TCCTCTTCGC AATTTCAAGG GTGGGAATGA 
GGGTGGGAGG TAAGGGTTTT GCAGGTGCAC GTGGTCAGCC 
GTGTGTTGAC GGCCAGGTGC GGTGGCTCAC GCCGGTAATC 
TCACCTGAGG TCAGGAGTTT GAGACCAGCC TGACCAACAT 
AAATTAGCTG GGCATGGTGG TGTGTGCCTG TAATCCCAGC 
TGAACCCAGG AGGCGGAGGC TGCAGTGAGC TGAGATTGTG 
GAAACTCTGT CTTTAAAAAA AAAAAGTGTT CGTTGATTGT 
ACTGTTCTCC AGCACAGATC CTGGTCCCAT CTTTAGGTAT 
AGATGGCTCC ACCTGCTGAG GAAGGGACAG TGTTTGTGGG 
CGTGTCGCCA CCCTGTTTTT CTGGATTTGA TGTTGAGGAA 
TGCTCCCAGG CCCTACCGTG GCAGCTAGAA GAAGTCCCGA 
ATGTAAGACT TCCGGCCATG CAGACAAGGA GGGTGACCTT 
TTATGGTGGC AAAAGTCATA TAACATGAGA TTGGCACTCC 
TGCTAACTCG GCGGTGTTTA CAGCAGGTTG CTTGAAATGC 
ATCGAACGGC AGCTGCCTCA CACCTGCTGC GGCTCAGGTG 
ACCCAGTTTT GCTTTTTGTG CTCCAGCTTC CTTCGTTGAG 
CCTGTCATTG CTGTTCTCTG ACTTCAGATG AGGTCACAAT 
TGGTCCCCGG GTGTCCCTGT CACGTGCAGG GTGAGTGAGG 
GGGTGAGTGA GGCGCGGCCC CCGGGTGTCC CTGTCCCGTG 
CCCTGTCACG TGTAGGGTGA GTGAGGCGCC ATCCCCGGGT 
TGGTCCCCGG GTGTCCCTGT CCCGTGCAGG GTGAGTGAGG 
GGGTGAGTGA GGCGCGGTCC CCGGGTGTCC CTCTCAGGTG 
CCCTGTCACG TGTAGGGTGA GTGAGGCACC GTCCCTGGGT 
CTGTCCCCGG GTGTCCCTGT CACGTGCAGG GTGAGTGAGG 
GGGTGAGTGA GGCGCTGTCC CTGGGTGTCC CTGTCTCGTG 
CCTTGGCGTT TGCTCACTTG AGCTTGCTCC TGAATGTTTG 
CCCATTGCCT GGGTAGATGG TGCAGGCGCA GTGCTGGTCC 
TCTTGGTCAC CTCTCCGTTC CATTTTGCTA CGGGGACACG 
GGCACTGCAG CCACAGCTTC AGGTCCGCTT. GCCTCTGTTG 
ATGCATGCTG CCAATACTCC TCTCCCAGCT TGTCTCATGC 
CTGCCACGTG TTGCTGGAGA CATCCCAGAA AGGGTTCTCT 
CCCCTCACTT GTCCTGTTTT CTCCCAAGCT GCCCCTCTGC 
TCACCTTATT CTGGGCACCT GCCGCTCATT GCTTAGGCTG 
ATTGACGTCC AGCCACAGGT TGGAGTGTCT CTGTCTGTCT 
GTCTCCGCCA GCCTTCGTCA GACTTCCCTC TTGGGTCTTA 
TTTCTATCTC TCCATTGTAT GCTTTTTCTT GGTTTATTCT 
CATGCCTTTC CCTCTAAGTG CTGCCTTACC TGCACCCTGT 



AAAGAGAAAT GACGGGCCTG TGTCAAGGAG 10570 
GGTCCCGCGT GCCCGTCCAG GGAGCAATGC 10640 
CCTCCCCTTC ACGTCCGGCA TTCGTGGTGC 10710 
TGGGTCTCCG GATCAGGCCA GCGGCCAAAG 10780 
GCCCCTCCCT CGGGTTACCC CACAGCCTAG 10850 
CCTGCACCCT GGGAGCGCGA GCGGCGCGCG 10920 
CAGCTGCGCT GTCGGGGCCA GGCCGGGCTC 10990 
CCACGTGGCG GAGGGACTGG GGACCCGGGC 11060 
CGCGGACCCC GCCCCGTCCC GACCCCTCCC 11130 
CCCCTTCCTT TCCGCGGCCC CGCCCTCTCC 11200 
ACGTGGGAAG CCCTGGCCCC GGCCACCCCC 11270 
TGCTGCGCAG CCACTACCGC GAGGTGCTGC 11340 
GCGGCTGGTG CAGCGCGGGG ACCCGGCGGC 11410 
TGGGACGCAC GGCCGCCCCC CGCCGCCCCC 11480 
TGGGGTTGAG GGCGGCCGGG GGGAACCAGC 11550 
CCGCAGGTGT CCTGCCTGAA GGAGCTGGTG 11620 
ACGTGCTGGC CTTCGGCTTC GCGCTGCTGG 11690 
CGTGCGCAGC TACCTGCCCA ACACGGTGAC 11760 
CGCCGCGTGG GCGACGACGT GCTGGTTCAC 11830 
GCTGCGCCTA CCAGGTGTGC GGGCCGCCGC 11900 
ACACGCTAGT GGACCCCGAA GGCGTCTGGG 11970 
GTCCCCCTGG GCCTGCCAGC CCCGGGTGCG 12040 
CCAAGAGGCC CAGGCGTGGC GCTGCCCCTG 12110 
CCCGGGCAGG ACGCGTGGAC CGAGTGACCG 12180 
GCCACCTCTT TGGAGGGTGC GCTCTCTGGC 12250 
CAGGCCCCCC ATCCACATCG CGGCCACCAC 12320 
CAAGCACTTC C7CTACTCCT CAGGCGACAA 12390 
CCCAGCCTGA CTGGCGCTCG GAGGCTCGTG 12460 
CTCCCCGCAG GTTGCCCCGC CTGCCCCAGC 12530 
GAACCACGCG CAGTGCCCCT ACGGGGTGCT 12600 
GCAGCCGGTG TCTGTGCCCG GGAGAAGCCC 12670 
CCCGTCGCCT GGTGCAGCTG CTCCGCCAGC 12740 
CCTGCGCCGG CTGGTGCCCC CAGGCCTCTG 12810 
AAGAAGTTCA TCTCCCTGGG GAAGCATGCC 12880 
GGGACTGCGC TTGGCTGCGC AGGAGCCCAG 12950 
TGAATGCAGT AGGGGCTCAG AAAAGGGGGC 13020 
CACACGTGGC TTTTCGCTCA GGACGTCGAG 13090 
GTTTGCATAA ACTTACGAGG TTCACCTTCA 13160 
GCAGTGAACA GAGGAGGCTG GGCGCGGCAG 13230 
CACAGACGCT CTGGCGAGGG TGCCTGCAGG 13300 
GAGGTGGGGA CGAGAACCCC CTCTTCCTGG 13370 
AATATGCAGG TTTGTGTTTA AGATTTAATT 13440 
CCAGCACTTT GGGAAGCTGA GGCAGGTGGA 13510 
GGTGAAACCC TATCTGTACT AAAAATACAA 13580 
TACTTGGGAG GCTGAGGCAG GAGAATCACT 13650 
CCATTGTACT CCAGCCTGGG CGACAAGAGT 13720 
GCCAGGACAG GGTAGAGGGA GGGAGATAAG 13790 
GAAGAGGGCC ACATGGGAGC AGAGGACAGC 13860 
TGTTCAGGGG ATGGTGCTGC TGGGCCCTGC 13930 
CCTCCGCTCC AGCCCCCTTT TGGCTCCCAG 14000 
TTTCACCCCC TCCCCACAAA CTCCCAAGAC 14070 
CTTGGGGCTC TTTTTTTTCT TTTTTTCTTT 14140 
TAACACCGTT TTCTGTGTAC AGTGCAGAAT 14210 
TGCGTCTTGC GTGACTGGAA GTCCCTACCC 14280 
GACCACGCCG AGTCAGATAA GCGTCATGCA 14350 
GAGAGTTTGA GTTCTCTGAT CAGGACTCTG 14420 
CTGCCCCTGG CTTATGCAGG GAGTGAGGCG 14 490 
CGTTGCCCCC AGGTGTCCCT GTCACGTGTA 14560 
CAGCGTGATT GAGGTGTGGC CCCCGGGTGT 14 630 
GTCCCTGTCA CGTGTAGGGT GAGTGAGGCG 14700 
CACTGTCCCC GGGTGTCCCT GTCACGTGCA 14770 
TAGGGTGAGT GAGGCGCGGC CCCAGGGTGT 14840 
GTCCCTCCCA GGTATAGGGT GAGTGAGGCA 14910 
CGCGGCCCCC GGGTGTCCCT CTCAGGTGCA 14980 
TAGGGTGAGT GAGGCTCTGT CCCCAGGTGT 15050 
CTCTTTCTAT AGCCACAGCT GCGCCGGTTG 15120 
CCAAGCCTAT CTTTTCTGAT GCTCGGCTCT 15190 
GGACTGCAGG CTCTCGCCTC CCGCGTGCCA 15260 
GGCCTGGCTT GCTCACCACG TGCCCGCCAC 15330 
CGAGGCTGGA CTCTGGGCTG CCTGTGTCTG 15400 
GTGCCCTGAA GGAAAGCAAG TCACCCCAGC 15470 
TTGGCCCCCT TGGGTGGGTG GCAACGCTTG 15540 
GGCTCTGCCT CCAGTCGCCC CCTCACATGG 15610 
CCTGCTCTGA GACCCACGTG GAGGGCCGGT 15680 
GTTTTGAATT TCACTGATTT ACCTCTGACG 15750 
TTCATTCCTT TTCTAGCTTC TTAGTTTAGT 15820 
GTTTTGATGT GAAGTAATCT CAACATCAGC 15890 
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CACTTTCAAG TGTTCTTAAA ATACTTCAAA GTGTTAATAC TTCTTTTAAG TATTCTTATT CTGTGATTTT 15960 
TTTCTTTGTG CACGCTGTGT TTTGACGTGA "AATCATTTTG ATATCAGTGA CTTTTAAGTA TTCTTTAGCT 16030 
TATTCTGTGA TTTCTTTGAG CAGTGAGTTA TTTGAACACT GTTTATGTTC AAGATATGTA GAGTATCAAG 16100 
ATACGTAGAG TATTTTAAGT TATCATTTTA TTATTGATTT CTAACTCAGT TGTGTAGTGG TCTGTATAAT 16170 
ACCAATTATT TGAAGTTTGC GGAGCCTTGC TTTGTGATCT AGTGTGTGCA TGGTTTCCAG AACTGTCCAT 16240 
TGTAAATTTG ACATCCTGTC AATAGTGGGC ATGCATGTTC ACTATATCCA GCTTATTAAG GTCCAGTGCA 16310 
AAGCTTCTGT CTCCTTCTAG ATGCATGAAA TTCCAAGAAG GAGGCCATAG TCCCTCACCT GGGGGATGGG 16380 
TCTGTTCATT TCTTCTCGTT TGGTAGCATT TATGTGAGGC ATTGTTAGGT GCATGCACGT GGTAGAATTT 16450 
TTATCTTCCT GATGAGTGAA TCTTTTGGAG ACTTCTATGT CTCTAGTAAT CTAGTAATTC TTTTTTTAAA 16520 
TTGCTCTTAG TACTGCCACA CTGGGCTTCT TTTGATTAGT ATTTTCCTGC TGTGTCTGTT TTCTGCCTTT 16590 
AATTTATATA TATATATATA TTTTTTTTTT TTTTGAGACA GAGTCTTGGT CTGTCGCCCA GGGTGAGTGC 16660 
AGTGGTGTGA TCACAGGTCA GTGTAACTTT TACCTTCTGG CCTGAGCCGT CCTCTCACCT CAGCCTCCTG 16730 
AGTAGCTGGA ACTGCAGACA CGCACCGCTA CACCTGGCTA ATTTTTAAAT TTTTTCTGGA GACAGGGTCT 16800 
TGCTGTGTTG CCCAGGCTGG TCTCAAACTC TTGGACTCAA GGGATCCATC TACCTCGGCT TCCCAAAGTG 16870 
CTGAATTACA GGCATGAGCC ACCATGTCTG GCCTAATTTT CAACACTTTT ATATTCTTAT AGTGTGGGTA 16940 
TGTCCTGTTA ACAGCATGTA GGTGAATTTC CAATCCAGTC TGACAGTCGT TGTTTAACTG GATAACCTGA 17010 
TTTATTTTCA TTTTTTTGTC ACTAGAGACC CGCCTGGTGC ACTCTGATTC TCCACTTGCC TGTTGCATGT 17080 
CCTCGTTCCC TTGTTTCTCA CCACCTCTTG GGTTGCCATG TGCGTTTCCT GCCGAGTGTG TGTTGATCCT 17150 
CTCGTTGCCT CCTGGTCACT GGGCATTTGC TTTTATTTCT CTTTGCTTAG TGTTACCCCC TGATCTTTTT 17220 
ATTGTCGTTG TTTGCTTTTG TTTATTGAGA CAGTCTCACT CTGTCACCCA GGCTGGAGTG TAATGGCACA 17290 
ATCTCGGCTC ACTGCAACCT CTGCCTCCTC GGTTCAAGCA GTTCTCATTC CTCAACCTCA TGAGTAGCTG 17360 
GGATTACAGG CGCCCACCAC CACGCCTGGC TAATTTTTGT ATTTTTAGTA GAGATAGGCT TTCACCATGT 17430 
TGGCCAGGCT GGTCTCAAAC TCCTGACCTC AAGTGATCTG CCCGCCTTGG CCTCCCACAG TGCTGGGATT 17500 
ACAGGTGCAA GCCACCGTGC CCGGCATACC TTGATCTTTT AAAATGAAGT CTGAAACATT GCTACCCTTG 17570 
TCCTGAGCAA TAAGACCCTT AGTGTATTTT AGCTCTGGCC ACCCCCCAGC CTGTGTGCTG TTTTCCCTGC 17640 
TGACTTAGTT CTATCTCAGG CATCTTGACA CCCCCACAAG CTAAGCATTA TTAATATTGT TTTCCGTGTT 17710 
GAGTGTTTCT GTAGCTTTGC CCCCGCCCTG CTTTTCCTCC TTTGTTCCCC GTCTGTCTTC TGTCTCAGGC 17780 
CCGCCGTCTG GGGTCCCCTT CCTTGTCCTT TGCGTGGTTC TTCTGTCTTG TTATTGCTGG TAAACCCCAG 17850 
CTTTACCTGT GCTGGCCTCC ATGGCATCTA GCGACGTCCG GGGACCTCTG CTTATGATGC ACAGATGAAG 17920 
ATGTGGAGAC TCACGAGGAG GGCGGTCATC TTGGCCCGTG AGTGTCTGGA GCACCACGTG GCCAGCGTTC 17990 
CTTAGCCAGT GAGTGACAGC AACGTCCGCT CGGCCTGGGT TCAGCCTGGA AAACCCCAGG CATGTCGGGG 18060 
TCTGGTGGCT CCGCGGTGTC GAGTTTGAAA TCGCGCAAAC CTGCGGTGTG GCGCCAGCTC TGACGGTGCT 18130 
GCCTGGCGGG GGAGTGTCTG CTTCCTCCCT TCTGCTTGGG AACCAGGACA AAGGATGAGG CTCCGAGCCG 18200 
TTGTCGCCCA ACAGGAGCAT GACGTGAGCC ATGTGGATAA TTTTAAAATT TCTAGGCTGG GCGCGGTGGC 18270 
TCACGCCTGT AATCCCAGCA CTTTGGGAGG CCAAGGCGGG TGGATCACGA GGTCAGGAGG TCGAGACCAT 18340 
CCTGGCCAAC ATGATGAAAC CCCATCTGTA CTAAAAACAC AAAAATTAGC TGGGCGTGGT GGCGGGTGCC 18410 
TGTAATCCCA GCTACTCGGG AGGCTGAGGC AGGAGAATTG CTTGAACCTG GGAGTTGGAA GTTGCAGTGA 18480 
GCCGACATTG CACCACTGCA CTCCAGCCTG GCAACACAGC GAGACTCTGT CTCAAAAAAA AAAAAAAAAA 18550 
AAAAAAAAAA AATTCTAGTA GCCACATTAA AAAAGTAAAA AAGAAAAGGT GAAATTAATG TAATAATAGA 18620 
TTTTACTGAA GCCCAGCATG TCCACACCTC ATCATTTTAG GGTGTTATTG GTGGGAGCAT CACTCACAGG 18690 
ACATTTGACA TTTTTTGAGC TTTGTCTGCG GGATCCCGTG TGTAGGTCCC GTGCGTGGCC ATCTCGGCCT 18760 
GGACCTGCTG GGCTTCCCAT GGCCATGGCT GTTGTACCAG ATGGTGCAGG TCCGGGATGA GGTCGCCAGG 18830 
CCCTCAGTGA GCTGGATGTG CAGTGTCCGG ATGGTGCACG TCTGGGATGA GGTCGCCAGG CCCTGCTGTG 18900 
AGCTGGATGT GTGGTGTCTG GATGGTGCAG GTCAGGGGTG AGGTCTCCAG GCCCTCGGTG AGCTGGAGGT 18970 
ATGGAGTCCG GATGATGCAG GTCCGGGGTG AGGTCGCCAG GCCCTGCTGT GAGCTGGATG TGTGGTGTCT 19040 
GGATGGTGCA GGTCAGGGGT GAGGTCTCCA GGCCCTCGGT AAGCTGGAGG TATGGAGTCC GGATGATGCA 19110 
GGTCCGGGGT GAGGTCGCCA GGCCCTGCTG TGAGCTGGAT GTGTGGTGTC TGGATGGTGC AGGTCTGGGG 19180 
TGAGGTCACC AGGCCCTGCG GTGAGCTGGG TGTGCGGTGT CTGGATGGTG CAGGTCTGGA GTGAGGTCGC 19250 
CAGACGGTGC CAGACCATGC GGTGAGCTGG ATATGCGGTG TCCGGATGGT GCAGGTCTGG GGTGAGGTTG 19320 
CCAGGCCCTG CTGTGAGTTG GATGTGGGGT GTCCGGATGC TGCAGGTCCG GTGTGAGGTC ACCAGGCCCT 19390 
GCTGTGAGCT GGATGTGTGG TGTCTGGATG GTGCAGGTCT GGGGTGAAGG TCGCCAGGCC CCTGCTTGTG 19460 
AGCTGGATGT GTGGTGTCTG GATGGTGCAG GTCTGGAGTG AGGTCGCCAG GCCCTCGGTG AGCTGGATGT 19530 
GCAGTGTCCA GATGGTGCAG GTCCGGGGTG AGGTCGCCAG ACCCTGCGGT GAGCTGGATG TGCGGTGTCT 19600 
GGATGGTGCA GGTCTGGAGT GAGGTCGCCA GGCCCTCGGT GAGCTGGATG TATGGAGTCC GGATGGTGCC 19670 
GGTCCGGGGT GAGGTCGCCA GACCCTGCTG TGAGCTGGAT GTGCGGTGTC TGGATGGTAC AGGTCTGGAG 19740 
TGAGGTCGCC AGACCCTGCT GTGAGCTGGA TATGCGGTGT CCGGATGGTG CAGGTCAGGG GTGAGGTCTC 19810 
CAGGCCCTCG GTGAGCTGGA GGTATGGAGT CCGGATGATG CAGGTCCGGG GTGAGGTCGC CAGGCCCTGC 19880 
TGTGAACTGG ATGTGCGGCG TCTGGATGGT GCAGGTCTGG GGTGTGGTCG CCAGGCCCTC GGTGAGCTGG 19950 
AGGTATGGAG TCCGGATGAT GCAGGTCCGG GGTGAGGTCG CCAGGCCCTG CTGTGAGCTG GATGTGCGGC 20020 
GTCTGGATGG TGCAGGTCTG GGGTGTGGTC GCCAGGCCCT CGGTGAGCTG GAGGTATGGA GTCCGGATGA 20090 
TGCAGGTCCG GGGTGAGGTT GCCAGGCCCT GCTGTGAGCT GGATGTGCTG TATCCGGATG GTGCAGTCCG 20160 
GGGTGAGGTC GCCAGGCCCT GCTGTGAGCT GGATGTGCTG TATCCGGATG GTGCAGGTCT GGGGTGAGGT 20230 
CACCAGGCCC TGCGGTGAGC TGGTTGTGCG GTGTCCGGTT GCTGCAGGTC CGGGGTGAGT TCGCCAGGCC 20300 
CTCGGTGAGC TGGATGTGCG GTGTCCCCGT GTCCGGATGG TGCAGGTCCA GGGTGAGGTC GCTAGGCCCT 20370 
TGGTGGGCTG GATGTGCCGT GTCCGGATGG TGCAGGTCTG GGGTGAGGTC GCCAGGCCTT TGGTGAGCTG 20440 
GATGTGCGGT GTCTGCATGG TGCAGGTCTG GGGTGAGGTC GCCAGGCCCT TGGTGGGCTG GATGTGTGGT 20510 
GTCCGGATGG TGCAGGTCCG GCGTGAGGTC GCCAGGCCCT GCTGTGAGCT GGATGTGCGG TGTCTGGATG 20580 
GTGCAGGTCC GGGGTGAGGT AGCCAAGGCC TTCGGTGAGC TGGATGTGGG GTGTCCGGAT GGTGCAGGTC 20650 
CGGGGTGAGG TCGCCAGGCC CTGCGGTTAG CTGGATATGC GGTGTCCGGA TGGTGCAGGT CCGGGGTGAG 20720 
GTCACCAGGC CCTGCGGTTA GCTGGATGTG CGGTGTCTGG ATGGTGCAGG TCCGGGGTGA GGTCGCCAGG 20790 
CCCTGCTGTG AGCTGGATGT GCTGTATCCG GATGGTGCAG GTCCGGGGTG AGGTCGCCAG GCCCTGCAGT 20860 
GAGCTGGATG TGCTGTATCC GGATGGTGCA GGTCTGGCGT GAGGTCGCCA GGCCCTGCGG TTAGCTGGAT 20930 
ATGCGGTGTC GGATGGTGCA GGTCCGGGGT GAGGTCACCA GGCCCTGCGG TTAGCTGGAT GTGCGGTGTC 21000 
CGGATGGTGC AGGTCTGGGG TGAGGTCGCC AGGCCCTGCT GTGAGCTGGA TGTGCTGTAT CCGGATGGTG 21070 
CAGGTCCGGG GTGAGGTCGC CAGGCCCTGC GGTGAGCTGG ATGTGCTGTA TCCGGATGGT GCAGGTCTGG 21140 
CGTGAGGTCG CCAGGCCCTG CGGTGAGCTG GATGTGCAGT GTACGGATGG TGCAGGTCCG GGGTGAGGTC 21210 
GCCAGGCCCT GCGGTGGGCT GTATGTGTGT TGTCTGGATG GTGCAGGTCC GGGGTGAGTT CGCCAGGCCC 21280 
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TGCGGTGAGC TGGATGTGTG GTGTCTGGAT GCTGCAGGTC 
TGGATATGCG GTGTCCCCGT GTCCGAATGG TGCAGGTCCA 
GATGTGCCGT GTCCGGATGG TGCAGGTCTG GGGTGAGGTC 
GTCCGGATGG TGCAGGTCCG GGGTGAGGTC ACCAGGCCCT 
TTTAAGGGGT TGGCTGTGTT CCGGCCGCAG AGCACCGTCT 
CTGGCTGATG AGTGTGTACG TCGTCGAGCT GCTCAGGTCT 
AAGAACAGGC TCTTTTTCTA CCGGAAGAGT GTCTGGAGCA 
TCCCCACGCC AGGCCTCTGC TTCTCGAAGT CCTGGAACAC 
CTTGCCTGTG CTTCCCTGGC TGTGCAGCTC TGGGCTGGGA 
GTGGATTCTG TGCAAGGCTC TGACTGCCTG GAGCTCACGT 
CAAGTGGTCT CTAGGGTTTG TAAAGCAGAA GGGATTTAAA 
GCCTTTCCCT GGGATGTGGG TCTGATTCTC TCTCTCTTTT 
TGTTGCCCAG GCTGGAGTGC AGTGGCATAA TCTTGGCTCA 
TTCACCAGCC TCAGCCTCCT AAGTAGCTGG GATTACAGGC 
CTTTTAGGAG AGACGGGGTT TCACCATGTT GGCCAGGCTG 
CCACCTTGGC CTCCCAAAGT GCTGGGTTTA CAGGCTAAGC 
TTCATGCTGT TCTGTATGAA TCTTCAATCT ATTGGATTTA 
GGCGACTCAC TGCAGGGAGC ACCTGTGCAG GGAGCACCTG 
TCTAGGTGGC TGCATTTGAA TGGCTGTGAG ATTTTGTCTG 
TGACAGATTC AAGCTGGATT TGCATCAGTG AGGGACGGGA 
AGCCCAGGCC ATGGTATTAG CTTCTCCGTG TCCCGCCCAG 
CAGGGCTTCC CCAGCTCCCC TGCACACTCG AGTCCCTGGG 
GGATGTCTGC AGAGGGAGCT GGCAGCAGAC CTCGTCAGAG 
CGTGGTGCTG GGGCCATTTC CTTGCATCTG GGGGAGGGTC 
ACAATGCACC TTACTTAGAC TTTACACGTA TTTAATGGTG 
TTTGGAAAGA ATTTAATTGG GGTGACCGGA AGGAGCAGAC 
CACTACTGGG ACTGTTGTTC TGCCTGGGGG GCCTTGGAGG 
TTTCTACTCT GCTGGGCCTG CGGCCTGCGG TCAGGGCACC 
ACGGAGTGCC AGGCTGTCAG CCACAGATGC CCAGGTCCAG 
GGGTGGTTTT GGGGGAAAAG GCCAAGGGCA GAGGTGTCAG 
GCTCCTTGGC TGAGCTGCCC TGAGCAGCCT CTCCCGCCCT 
CTGGGGGTCC TGCCTGGGGC CAGCCTTGGG CTACCCCAGT 
GGAGGGGCAT GGGTTCACGT GGCCCCAGAT GCAGCCTGGG 
GTCACCCTGG GGGTTGACCG CCGGACTGGG CGTCCCCAGG 
CTGCAAGTAG AGGGGCTCTC AGAGGCGTCT GGCTGGCATG 
CGTGTGCTGC CGTGGGTGCC CTGAGCCCTC ACTGAGTCGG 
CCTAGTCTGT TGTCTGGCTG AGCAAGCCTC CTGAGGGGCT 
CAGCTGCGGG AGCTGTCGGA AGCAGAGGTC AGGCAGCATC 
GACTCCGCTT CATCCCCAAG CCTGACGGGC TGCGGCCGAT 
AACGTTCCGC AGAGAAAAGA GGGTGGCTGT GCTTTGGTTT 
GCCCCACATT TGGTATCAGC TTAGATGAAG GGCCCGGAGG 
CACGGCGCCA ACCCATTTGT GCGCACAGTG AGGTGGCCGA 
GGGTGTAGGG GGAGCTCCTG GGGCAGGGAC AGGCTCTGAG 
GATGCAGCAC GGCCCGAGGT CCTGGATCCG TGTCCTGCTG 
CGGGGCCCGG GGACCAGGCC ACGACTGCCA GGAGCCCACC 
GGCTCCTGCA CCCCACCCCT GTGGCTGCGG TGGCTGCGGT 
AGGTGGACAG AGGTGTGGCA TGAGGATCCC GTGTGCAACA 
GGTCTGAGGA AGCTGGGAGG GGTTCTAGGT CCCGGGTCTG 
TCTCCCCTGG GTCCCTATGG TGGGGTGGGC ACTTGGCCGG 
CCCCGCCAGG CCGAGCGTCT CACCTCGAGG GTGAAGGCAC 
GGCGCCCCGG CCTCCTGGGC GCCTCTGTGC TGGGCCTGGA 
GCTGCGTGTG CGGGCCCAGG ACCCGCCGCC TGAGCTGTAC 
GAGCAGCCCT GCTGGACCTT GGGAGTGGCT GCCTGATTGG 
GGGTGGGCCG CAGGGAGTGC AGGTGACCCT GTCACTGTTG 
TTCAGCCTTT CCTGCAGCAC ATGGGGCCGA CTGTGCACCC 
GTCCCACTGG ATTCCAGTTT CCGTCAGAGA AGGAACCGCA 
CACCCCAGTC CTGAGCCAGG GGTCTCCTGT CCTGAGGCTC 
GGGTCTGGAG TGGTGGGGGT CAGAGAGAGA GTGGGGGACA 
ATGTCTGAGT TTCTGCGTGG CCACTGTCAG TCTCCTCGCC 
GTACGACACC ATCCCCCAGG ACAGGCTCAC GGAGGTCATC 
TGCGTGCGTC GGTATGCCGT GGTCCAGAAG GCCGCCCATG 
TAAGGTTCAC GTGTGATAGT CGTGTCCAGG ATGTGTGTCT 
GTGTCTGTGA TGCGTTTCTG TGGTGGAGGT ACTTCCATGA 
CGTGTGTGTC GTGGTGCATG TATCTGTGGC GTGCATATTT 
CCATGGTGTG TGTGCCTGTG GTGTGCATGT GTGTGTGTCT 
CATGTCTGTG ATGTGCCTAT TTGTGGTGTG TGTGTGCATG 
GGTGTGTGTG GCCCCTTGGC CTTACTCCTT CCTCCTCCAG 
CGGGTGCTGG TTTGGGGAGC TCCACATTCA GGGTCCTCAC 
GGGCTGGGCC TTGGAGACTG TAAGCCAGGT TTGAGAGGAG 
CCCTGGCACC CCCAGGACCC CAGTCTGGCC TATGCCGGCT 
TCGCTCCCCG GGACACACTC CTCCCAGAGC GGCCGGGGGC 
TGGGCTTGGG TTCCCACCCA GTGGTCATGA GCACGCTGGA 
GGGTGCAGAG GTGAAGAAGT ATCCCTGGAG CTTCGGTCTG 
CCTCTTTCTC TGACTTCTTG AGCT 



CGGGGTGAGT TCGCCAGGCC CTCGGTGAGC 21350 
GGGTGAGGTC GCCAGGCCCT TGGTGGGCTG 21420 
GCCAGGCCCT TGGTGAGCTG GATGTGCGGT 21490 
CGGTGATCTG GATGTGGCAT GTCCTTCTCG 21560 
GCGTGAGGAG ATCCTGGCCA AGTTCCTGCA 21630 
TTCTTTTATG TCACGGAGAC CACGTTTCAA 21700 
AGTTGCAAAG CATTGGAATC AGGTACTGTA 21770 
CAGCCCGGCC TCAGCATGCG CCTGTCTCCA 21840 
GCCAGGGGCC CCGTCACAGG CCTGGTCCAA 21910 
TCTCTTACTT GTAAAATCAG GAGTTTGTGC 21980 
TTAGATGGAA ACACTACCAC TAGCCTCCTT 22050 
TTTTTTCTTT TTTGAGATGG AGTCTCACTC 22120 
CTGCAACCTC CACCTCCTGG GTTTAAGCGA 22190 
ACCTGCCACC ACGCCTGGCT AATTTTTGTA 22260 
GTCTCGAACT CATGACCTCA GGTGATCCAC 22330 
CACCGTGCCC AGCCCCCGAT TCTCTTTTAA 22400 
GGTCATGAGA GGATAAAATC CCACCCACTT 22470 
GGGATAGGAG AGTTCCACCA TGAGCTAACT 22540 
CAATGTTCGG CTGATGAGAG TGTGAGATTG 22610 
GCGCTGGTCT GGGAGATGCC AGCCTGGCTG 22680 
GCTGACTGTG GAGGGCTTTA GTCAGAAGAT 22750 
GGGCCTTGTG ACACCCCATG CCCCAAATCA 22820 
GTAACACAGC CTCTGGGCTG GGGACCCCGA 22890 
AGGGCTTTCC CTGTGGGAAC AAGTTAATAC 22960 
TGCGACCCAA CATGGTCATT TGACCAGTAT 23030 
AGACGTGGTG GTCCCCAAGA TGCTCCTTGT 23100 
CCCCTCCTCC CTGGACAGGG TACCGTGCCT 23170 
AGCTCCGGAG CACCCGCGGC CCCAGTGTCC 23240 
GTGTGGCCGC TCCAGCCCCC GTGCCCCCAT 23310 
GAGACTGGTG GGCTCATGAG AGCTGATTCT 23380 
CTCCATCTGA AGGGATGTGG CTCTTTCTAC 23450 
GGCTGTACCA GAGGGACAGG CATCCTGTGT 23520 
ACCAGGCTCC CTGGTGCTGA TGGTGGGACA 23590 
GTTGACTATA GGACCAGGTG TCCAGGTGCC 23660 
GGTGGACGTG GCCCCGGGCA TGGCCTTCAG 23730 
TGGGGGCTTG TGGCTTCCCG TGAGCTTCCC 23800 
CTCTATTGCA GACAGCACTT GAAGAGGGTG 23870 
GGGAAGCCAG GCCCGCCCTG CTGACGTCCA 23940 
TGTGAACATG GACTACGTCG TGGGAGCCAG 24010 
AACTTCCTTT TTAAACAGAA GTGCGTTTGA 24080 
AGGGGCCACG GGACACAGCC AGGGCCATGG 24150 
GGTGCCGGTG CCTCCAGAAA AGCAGCGTGG 24220 
GACCACAAGA AGCAGCCGGG CCAGGGCCTG 24290 
TGGTGCGCAG CCTCCGTGCG CTTCCGCTTA 24 360 
GGGCTCTGAG GATCCTGGAC CTTGCCCCAC 24 430 
GACCCCGTCA TCTGAGGAGA GTGTGGGGTG 24500 
CACATGCGGC CAGGAACCCG TTTCAAACAG 24570 
GGTGGCTGGG GACACTGGGG AGGGGCTGCT 24640 
ATCCACTTTC CTGACTGTCT CCCATGCTGT 24710 
TGTTCAGCGT GCTCAACTA'C GAGCGGGCGC 24780 
CGATATCCAC AGGGCCTGGC GCACCTTCGT 24850 
TTTGTCAAGG TGGGTGCCGG GGACCCCCGT 24920 
CACCTCATGT TGGGTGGAGG AGGTACTCCT 24990 
AGGACACACC TGGCACCTAG GGTGGAGGCC 25060 
TGACTGCCCG GGCTCCTATT CCCAAGGAGG 25130 
ACGGCTCAGC CACCAGGCCC CGGTGCCTTG 25200 
AGAGAGGGGA CACAGCCCGC CCTGCCCTTG 25270 
CCGCCAGGCC AGGCCCTGAG GGCAGAGGTG 25340 
TCCACTCACA CAGGTGGATG TGACGGGCGC 25410 
GCCAGCATCA TCAAACCCCA GAACACGTAC 25480 
GGCACGTCCG CAAGGCCTTC AAGAGCCACG 25550 
CTGGGATATG AATGTGTCTA GAATGCAGTC 25620 
TTTACACATC TGTGATATGC GTGTGTGGCA 25690 
GTGGTGTGTG TGTGTGTGGC ACGTGTGTGT 25760 
GTGACACGTG CATGTTCATG CTGTGTGCTG 25830 
TGTCCGTGAC ATATGCGTGT CTATGGCATG 25900 
GCATGGTCCG CACCATTGTC CTCACGCTCT 25970 
TTCTAGCATG GGTGCCCCTG TCCTGTCACA 26040 
AGTAGGGATG CTGGTGGTAC CTTCCTGGAC 26110 
CCATGAGATA TAGGAAGGCT GATTCAGGCC 26180 
CTTGGGGCTC GGCAGGGGTG AAAGGGGCCC 26250 
GGGGTAAGCC CTCAAAGTCG TGCCAGGCCG 26320 
GGGAGAGGCA CATGTGGAAA CCCACAAGGA 26390 
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Contig2: 

TGTGGGATTG GTTTTCATGT GTGGGATAGG TGGGGATCTG TGGGATTGGT TTTTATGAGT GGGGTAACAC 70 
AGAGTTCAAG GCGAGCTTTC TTCCTGTAGT GGGTCTGCAG GTGCTCCAAC AGCTTTATTG AGGAGACCAT 140 
ATCTTCCTTT GAACTATGGT CGGGTTTATA GTAAGTCAGG GGTGTGGAGG CCTCCCCTGG GCTCCCTGTT 210 
CTGT.TTCTTC CACTCTGGGG TCGTGTGGTG CCTGCTGTGG TGTGTGGCCG GTGGGCAGGG CTTCCAGGCC 280 
TCCTTGTGTT CATTGGCCTG GATGTGGCCC TGGCTACGCT CCGTCCTTGG AATTCCCCTG C GAGT TGGAG 350 
GCTTTCTTTC TTTCTTTTTT TCTTTCTTTT TTTTTTTTTT TGATAACAGA GTCTCGCTCT TTTTTGCCCA 420 
GGCTGGAGTG GTTTGGCGTG ATCTTGGCTC ACTGCAACCT GTGCTTCCTG AGTTCAAGCA ATTCTCTTGC 490 
CTCAGCCTCC CAAGTAGCTG GAATTATAGG CGCCCACCAC CATGCTGACT AATTTTTGTA ATTTTAGTAG 560 
AGACGAGGTT TCTCCATGTT GGCCAGGCTG GTCTCGAACT CCTGACCTCA GGTGATCCTC CCACCTCGGC 630 
CTCCCAAAGT GCTGGGATGA CAGGTGTGAA CCGCCGCGCC CGGCCGAGAC TCGCTTCCTG CAGCTTCCGT 700 
GAGATCTGCA GCGATAGCTG CCTGCAGCCT TGGTGCTGAC AACCTCCGTT TTCCTTCTCC AGGTCTCGCT 770 
AGGGGTCTTT CCATTTCATG ACTCTCTTCA CAGAAGAGTT TCACGTGTGC TGATTTCCCG GCTGTTTCCT 840 
GCGTAATTGG TGTCTGCTGT TTATCGATGG CCTCCTTCCA TTTCCTTTAG GCTTTGTTTA TTGTTGTTTT 910 
TCCGGCTCCT TGAAGGAAAA GTTTCGATTA TGGATGTTTG AACTTTCTTT TCTAAACAAG CATCTGAAGT 980 
TGCCGTTTTC CCTCTAAAGC AGGGATCCCG AGGCCCCTGG CTGTGGAGTG GCACCGGTCT GGGGCCTGTT 1050 
AGGAACCCGG CGCACAGCGG GAGGCTAGGT GGGGTGTGGG GAGCCAGCGT TCCCGCCTGA GCCCCGCCCC 1120 
TCTCAGATCA GCAGTGGCAT GCGGTGCTCA GAGGCGCACA CACCCTACTG AGAACTGTGC GTGAGAGGGG 1190 
TCTAGATTCT GTGCTCCTTA TGGGAATCTA ATGCCTGATG ATCTGAGGTG GAACCGTTTG CTCCCAAAAC 1260 
CATCCCCTTC CCCACTGCTG TCCTGTGGAA AAATCGTCTT CCACGAAACC AGTCCCTGGT ACCACAATGG 1330 
TTGGGGACCC TGTGCTAAAG ACCTGCTTCA GCAGCCTCTC GTCAGTGTTG ATATATTGGC TTTTCTGTGT 1400 
TGAGTCCAGA ATAATTACGG ATTTCTGTGA TGCTTTCCGC CGACCTCAGA CCCATGGGCT ATTTGTGGGC 1470 
GTGTTGCCTG CTCCTGGGTT GGGAAGGGTG CAGGCCCCAT GTACCTTCCT GTTACTGCCT TCCAGGTTGG 1540 
TTCTCAGGGT TGAATCGTAC TGGATGTGGT TTTAGCCCAC GGCCCTGCCG CCAGCTCCTG GGGGCTGGGG 1610 
AACATGCTGA AGCACAGAGT CACCGTGCGC GTCTTTTGAT GCCTCACAAG CTCGAGGCCT CCTGTGTCCG 1680 
. TGTTAGTGTG TGTCACGTGC CTGCTCACAT CCTGTCTTGG GGACGCAGGG GCTTAGCAGG TCCCGTAGTA 1750 
AATGACAAGC GTCCTGGGGG AGTCTGCAGA ATAGGAGGTG GGGGTGCCGG TCTCTCTCCC GCGTCTTCAG 1820 

• ACTCTTCTCC TGCCTGTGCT GTGGCTGCAC CTGCATCCCT GCAATCCCTC CAGCACTGGG CTGGAGAGGC 1890 
CCGGGAGCTC GAGTGCCACT TGTGCCACGT GACTGTGGAT GGCAGTCGGT CACGGGGGTC TGATGTGTGG 1960 
TGACTGTGGA TGGCGGTTGG TCACAGGGGT CTGATGTGTG GTGACTGTGG ATGGCGGTCG TGGGGTCTGA 2030 
TGTGGTGACT GTGGATGGCG GTCGTGGGGT CTGATGTGTG GTGACTGTGG ATGGCGGTCG TGGGGTCTGA 2100 
TGTGGTGACT GTGGATGGCG GTCGTGGGGT CTGATGTGGT GACTGTGGAT GGCGGTCGTG GGGTCTGATG 2170 
TGGTGACTGT GGATGGCAGT CGTGGGGTCT GATGTGTGGT GACTGTGGAT GGCGGTCGTG GGGTCTGATG 2240 

;■ TGGTGACTGT GGATGGCAGT CGTGGGGTCT GATGTGTGGT GACTGTGGAT GGCGGTCGTG GGGTCTGATG 2310 
TGTGGTGACT GTGGATGGCG GTCGTGGGGT CTGATGTGTG GTGACTGTGG ATGGCGGTCG TGGGGTCTGA 2380 
TGTGTGGTGA CTGTGGATGG CGGTCGTGGG GTCTGATGTG GTGACTGTGG ATGGCGGTCG TGGGGTCTGA 2450 
TGTGTGGTGA CTGTGGATGG TGATCGGTCA CAGGGGTCTG ATGTGTGGTG ACTGTGGATG GCGGTCGTGG 2520 
GGTCTGATGT GTGGTGACTG TGGATGGTGA TCGGTCACAG GGGTCTGATG TGTGGTGACT GTGGATGGCG 2590 
GTCGTGGGGT CTGATGTGTG GTGACTGTGG ATGGCGGTTG GTCCCGGGGG TCTGATGTGT GGTGACTGTG 2660 
GATGGCGATC GGTCACAGGG GTCTGATGTG TGGTGACTGT GGATGGCGGT CGTGGGGTCT GATGTGTGGT 2730 
GACTGTGGAT GGCGGTCGTG GGGTCTGATG TGTGGTGACT GTGGATGGCG GTCGTGGGGT CTGATGTGGT 2800 
GACTGTGGAT GGCGGTCGTG GGGTCTGATG TGGTGACTGT GGATGGCGGT CGTGGGGTCT GATGTGTGGT 2870 
GACTGTGGAT GGCGGTTGGT CCCGGGGGTC TGATGTGTGG TGACTGTGGA TGGCGGTCGT GGGGTCTGAT 2940 
GTGGTGACTG TGGATGGCAG TCGTGGGGTC TGATGTGTGG TGACTGTGGA TGGCGGTCGT GGGGTCTGAT 3010 
GTGTGGTGAC TGTGGATGGC GGTCGTGGGG TCTGATGTGT GGTGACTGTG GATGGCGGTC GTGGGGTCTG 3080 
ATGTGTGGTG ACTGTGGATG GCGGTCGTGG GGTCTGATGT GGTGACTGTG GATGGCGGTC GTGGGGTCTG 3150 
ATGTGTGGTG ACTGTGGATG GTGATCGGTC ACAGGGGTCT GATGTGTGGT GACTGTGGAT GGCGGTCGTG 3220 
GGGTCTGATG TGTGGTGACT GTGGATGGCG GTCGTGGGGT CTGATGTGGT GACTGTGGAT GGCGGTCGTG 3290 
GGGTCTGATG TGTGGTGACT GTGGATGGCG GTCGTAGGGT CTGATGTGTG GTGACTGTGG ATGGCAGTCG 3360 
GTCACAGGGG TCTGATGTGT GGTGACTGTG GATGGCGGTC GTGGGGTCTG ATGTGTGGTG ACTGTGGATG 3430 
GCGGTCGTGG GGTCTGATGT GTGGTGACTG TGGATGGCGG TCGTGGGGTC TGATGTGTGG TGACTGTGGA 3500 
TGGCGGTCGT GGGGTCTGAT GTGGTGACTG TGGATGGTGA TCGGTCACAG GGGTCTGATG TGTGGTAGCT 3570 
GCAGGTGGAG TCCCAGGTGT GTCTGTAGCT ACTTTGCGTC CTCGGCCCCC CGGCCCCCGT TTCCCAAACA 3640 
GAAGCTTCCC AGGCGCTCTC TGGGCTTCAT CCCGCCATCG GGCTTGGCCG CAGGTCCACA CGTCCTGATC 3710 
GGAAGAAACA AGTGCCCAGC TCTGGCCGGG GCAGGCCACA TTTGTGGCTC ATGCCCTCTC CTCTGCCGGC 3780 
AGGTCTCTAC CTTGACAGAC CTCCAGCCGT ACATGCGACA GTTCGTGGCT CACCTGCAGG AGACCAGCCC 3850 
GCTGAGGGAT GCCGTCGTCA TCGAGCAGGT CTGGGCACTG CCCTGCAGGG TTGGGCACGG ACTCCCAGCA 3920 
GTGGGTCCTC CCCTGGGCAA TCACTGGGCT CATGACCGGA CAGACTGTTG GCCCTGGGGG GCAGTGGGGG 3990 
GAATGAGCTG TGATGGGGGC ATGATGAGCT GTGTGCCTTG GCGAAATCTG AGCTGGGCCA TGCCAGGCTG 4060 
CGACAGCTGC TGCATTCAGG CACCTGCTCA CGTTTGACTG CGCGGCCTCT CTCCAGTTCC GCAGTGCCTT 4130 
TGTTCATGAT TTGCTAAATG TCTTCTCTGC CAGTTTTGAT CTTGAGGCCA AAGGAAAGGT GTCCCCCTCC 4200 
TTTAGGAGGG CAGGCCATGT TTGAGCCGTG TCCTGCCCAG CTGGCCCCTC AGTGCTGGGT CTGAGGCCAA 4270 
AGGAAACGTG TCCCCCTTCT TAGGAGGACG GGCCGTGTTT GAGCCACGCC CCGCTGAGCG GGCCTCTCAG 4340 
TGCTGGGTCT GTCCACGTGG CCCTGTGGCC CTTTGCAGAT GTGGTCTGTC CACGTGGCCC TGTGGCTCTT 4410 
TGCAGATGCC TGTTAGCACT TGCTCGGCTC TAGGGGACAG TCGTGTCCAC CGCATGAGGC TCAGAGACCT 4480 
CTGGGCGAAT TTCCTTGGCT CCCAGGGTGG GGGTGGAGGT GGCCTGGGCT GCTGGGACCC AGACCCTGTG 4550 
CCCGGCAGCT GGGCAGCAAC TCCTGGATCA CATATGCCAT CCGGGCCACG GTGGGCTGTG TGGGTGTGAG 4620 
CCCAGCTGGA CCCACAGGTG GCCCAGAGGA GACGTTCTGT GTCACACACT CTGCCTAAGC CCATGTGTGT 4690 
CTGCAGAGAC TCGGCCCGGC CAGCCCACGA TGGCCCTGCA TTCCAGCCCA GCCCCGCACT TCATCACAAA 4760 
CACTGACCCC AAAAGGGACG GAGGGTCTTG GCCACGTGGT CCTGCCTGTC TCAGCACCCA CCGGCTCACT 4830 
CCCATGTGTC TCCCGTCTGC TTTCGCAGAG CTCCTCCCTG AATGAGGCCA GCAGTGGCCT CTTCGACGTC 4900 
TTCCTACGCT TCATGTGCCA CCACGCCGTG- CGCATCAGGG GCAAGTGAGT CAGGTGGCCA GGTGCCATTG 4970 
CCCTGCGGGT GGCTGGGCGG GCTGGCAGGG CTTCTGCTCA CCTCTCTCCT GCCCCTTCCC CACTGNCCTT 5040 
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CTGCCCGGGG CCACCAGAGT CTCCTTTTCT GGCCCCCGCC 
GGCCCCGGAA ACATGGCTCG GCTTGCGGCA GCCGGAGCGG 
AAGCGGGGTG TGGAGTTGCT CCTGCGTGGA GGACGAGGGG 
GAGCGTTTGA GCCTGCAGCT TGTCAGCTCC AAGTTACTAC 
GTATCTCTCT CTCCCGATAC AAAAGGATTT TATCCGATTC 
GAGGGCGCGG GCTCTTCTCT CTGTGACTAG ATTTCCCATC 
CTCCTCTCGG GGGGCCTGTG GTGGCCATGG GGCAGGCGGC 
GTGAGCCACA CTCACGGTGG TAGAGCCACA GTGCCTGGTG 
ACCACACACC TCCCGGCAGG CATCTGCCTG CGACCCTGTG 
AATTCGTGCA CACTCAAGGT CATCAGCAAG GTCATCCGCA 
GATCGTCTCC AGCGGATAAA GGACTGTGCA CAGCTTCGGA 
ATTGCATTAT AAGTAATCAC TAATGGTATC AGCAATTATA 
AGTAGTACAC ACGTTCTGGA AAAACACAAA TTGCACATGG 
TGTGCACATG TGTGTAAGCG GCCCCCAGGC CCACAGAATT 
ACCACGGGCC TCCTTCGTGG TCGTGAATTT TATTAAGATG 
GGGCTTTGGG GAATGTGAGG TGATGACTGC GTCCTCATGC 
CTGTCCCTAG GACACGGACA GGCCCGAAGC TCTAGTCCCC 
ACGTCTTCAA AACCTGTTGC CCCAAAAACT AAGAACAGAG 
CGTATCTGCT TGCGTTGACT CGCTGGGCTG GCCGGACTCC 
AGTGCAGTCC TCTTGCCCAT CACTGTGATA TCTGCACCAG 
TTTTTTTTTT GAGACGGAAC GTCACTGTTG TCTGCCTGGG 
TGCAACCTCC GCCTCCCGGG TTCCAGCATT TCTCCTGCCT 
CCCACCCCCT GCGCCTGGCT AATTTTTGTA TTTTTAGTAG 
GTCTCGAACT CCTGACCTCA GGTGATCCAC CCACCTCGGC 
CCATCACGCC CAGCCGGAAA GCCTCTTTTT AAGGTGACCA 
TGTTTTTGCA GTAGGCTGCA AGCGTCTCTT AGCAACAGGA 
AGGGTCGCGT GGCAGCCATG CCTTCTGTGT GCACCTTTAG 
TGTGTGAAAA CGCACCCTTG GCATCCTTGT TTGGAGAGTT 
GGGCAAGGTT GTATCCGTTG GCGCGCAGCG GCTACATGTA 
CCTTGAAAAA AAAAAAAGGA GTCCGGTTAA GCATTCATTC 
TCTAAGATTT AAGAAACCTT AATGAAAGAA AACCTTGATG 
GCTGGATCTG TTTCAGCCGC CCCAGTGCAT GGTGAGAGTG 
ATCTGGTATG TTTCTGAGGT GTTTGCCGGC TGAATGGTAG 
TCTGTGTGTG GCTCGGTTTG AGTGTACGCA TGTCCAGCAC 
CCGCCCCAGG TCCTACGTCC AGTGCCAGGG GATCCCGCAG 
CTGTGCTACG GCGACATGGA GAACAAGCTG TTTGCGGGGA 
CCAGGGGGGC TTGGGTGGGG GTTGATTTGC TTTTGATGCA 
ACCATGACTG CTCTGTCTTG AGGAACCAGA CAAGGTTGCA 
GGGTTGCACA GCCTGAGGAC TGCGGGCTCC ACGCAGGCTC 
GCTCAGCAGG CGGGAGGGCC GCTGCCCTGC ATGATGAGCA 
CTTCTGTCAC GTCACCCAGG TTCCGTTAGG GTCCTTGGGG 
ATCTCCCAGC AGGCCCTCGA CAGGTGGCCT GGACTGGGCG 
ATGGGGTCTA CACCCAAGGA CGCACACACC TAAATATCGT 
TTTTATTGAC AGCAGTTACT TTTTTTTTTT TAATACTTTA 
GTTAGTTACA TATGTATACA TGTGCCATGT TGGTGTGCTG 
TATCTCCTAA TGCTATCCCT CCCCACTCCC CCCATCCCAT 
CTGTGTCCAA GTGTTCTCAT TGTTCAGTTC CCACCTGTGA 
CTTGCAATAG TTTGCTCAGA GTGATGGTTT CCAGCTTCGT 
CTTTTTTATG ACTGCATAGT ATTCCGTGGT GTATATGTGC 
GGACATTTGG GTTGGTTGCA AGTCTTTGCT ACTGTGAATA 
CTTTATAGCA GCATGATTTA TAATCCTTTG GGTATATACC 
TTCTAGTTCT AGATCCTTGA GGAATCACCA CACTGTCTTC 
CAACAGTGTA AAAGTGTTCT GGTGCTGGAG AGGATGTGGA 
ACTGAACAAG CAGACAGTTA GTGAAGGATG CGTCAGGAAG 
GACTCCGGGT TTTTCCTGTG CATCTTTTGA AACTCTAGCT 
TCTTCTTCAT TAAGGTTCAA GTTCTAGATT GAAAT AAGTT 
CACAACTTGC TCTGGGATTT GGAGGAAAGT GTCCTCGAGC 
GGATACCTCT GGCCCATGGT CATGGGGCGC TGGGCTTGGG 
CTTCCTGTGG ATAGGATCTG GGTCTCGGAT CATGCTGAGG 
ACGTGGCTCA GAGGGGGCGA GGTTCCCAGC CCCAGCTTTC 
TCTGAGAAGT GGGGCCGCGC CTGATGGCCT TCGTTCGTCT 
GTAAACACTG AGTACTTATA ATGAATGAGG AATTGCTGTA 
AAAGAAATTT AAGTT TTTCA TTTAACCGCT TTGGAGAATG 
GACATTCAGT CCCTCGTAGA CAGATACTAC GTAAAAAGTG 
ATTTTAGGCT GCTCCTGCGT TTGGTGGATG ATTTCTTGTT 
CTTCCTCAGG TGAGGCCCGT GCCGTGTGTC TGTGGGGACC 
CCCCGTGTCC TGCCCCTGGC ACCGCAGCGT TGTCTCTGCC 
GCAAGAGCAG AGGCGCTTGG CCGTGCACCC AGGCCTGGGG 
ACCGTGCAGG CCCTGGTCCT GCAGAGACGC ACCCAGGTTA 
CTCCTGCTGC TCTTTGGAAA GTCAAGAGTG GCGGCTCCTG 
ACAGGGCCTG CAGGGCCGAG GCGGCAGCCT CCTCCCCAGG 
GCTGAGTGAG CTGGCCCACA GCGTTCGCTG CGGTCACGTT 
GAATTTGGAT TTGCTGAGTG CTGCTGTCTT GAACCACGGA 
TTTGTGAATC AAACTAAAAT CAGGCACAGG GGACCTGGCC 
CCTCAAGGGC GCCCCACAGA GCCGGTGGGC TTGTTTTAAA 
AAAGCTGTAA AGGGAACCCT CAGAAAATGT GGCCGCCAGG 
TTGTGAAAAC CCATTTGGAC CCGCCCTCCA AGTCCACCCT 



CCCTCCGGCT CCTGGGCTGC AGGCTCCCGA 5110 
AGCAGGTGCC ACACGAGGCC TGGAAATGGC 5180 
CGGGGGGTGT GTCTGGGTCA GGTGTGCGCC 5250 
TGACGCTGGA CACCCGGCTC TCACACGCTT 5320 
TCATTCCTGT CCCTGTCGTG TGACCCCCGC 5390 
TGGAAAGTGC GGGGTTGACC GTGTAGTTTG 5460 
CTGGGAGAGC TGCCGTCACA CAGCCACTGG 5530 
CCACATCACG TCCTCTGGAT TTTAAGTAAA 5600 
TGTGCCTGGG GAGAGTGGTA GCACGGAGGA 5670 
GTCAGGTGGA ACGTGGAGGC CTCTCTCTGG 5740 
AGCTTTTATT TAAAAATATA ACTATTAATT 5810 
ATATTTATTA AAGTATAATT AGAAATATTA 5880 
CAGCAGAGTG AATTTTGGCC GAGGGACACG 5950 
CGCTGACAAA GTCACCTCCC CAGAGAAGCC 6020 
GATCAAGTCA CGTACCGTCC ACGTGTGGCA 6090 
CCTGACAGAC AGGAGGTGAC TGTGTCTGTC 6160 
ATCGTGGTCC AGTTTGGCCT CTGAATAAAA 6230 
AGAGTTTCCC ATCCCATGTG CTCACAGGGG 6300 
TAGAGTTGGT GCGTGTGCTT CTGTGCAAAA 6370 
CAAGGAAAGC CTCTTTTCTT TTCTTTCTTT 6440 
CTTGAGTGCA GTGGCGCGAT CTCAACTCAC 6510 
CAGCCTCCCG AGCAGCTGAG ATTACAGGCA 6580 
AGAGGGGTTT TTGCCATGTT GGCCAGGCTG 6650 
CTCCCAAAGT GCTGGGATTA CAGGTGTGAG 6720 
CCTATAGCGC TTCCCGAAAA TAACAGGTCT 6790 
GTGGCGTCCT GTGGGCTCTG GGGATGGCTG 68 €0 
GTTCCACGGG GCTATTCTGC TCTCACTGTT 6930 
TCTGCTTCTC GTTGGTCATG CTGAAACTAG 7000 
GGGTCATGAG TCTTTCACCG TGGACAAATT 7070 
CGGGTCAAGT GTCTGGTTCT GTGAATAAAC 7140 
ATTCAGAGCA AGGATGTGGT CACACCTGTG 7210 
GGGAGCAGGG ATTGTTTGTT CAGAGGTCTC 7280 
ACGTGTCGTT TGTGTGTATG AGGTTCTGTG 7350 
ATGCCCTGCC CGTCTCTCAC CTGTGTCTTC 7420 
GGCTCCATCC TCTCCACGCT GCTCTGCAGC 7490 
TTCGGCGGGA CGGGTGAGGC CTCCTCTTCC 7560 
TTCAGTGTTA ATATTCCTGG TGCTCTGGAG 7630 
GCCCCTTCTT GGTATGAAGC CGCACGGGAG 7700 
TGTCCAGCGG CCATGTCCAG AGGCCTCAGG 7770 
TGTGAATTCA ACACCGAGGA AGCACACCAG 7840 
AGATGGGGCT GGTGCAGCCT GAGGCCCCAC 7910 
CCTCTTCAGC CCATTGCCCA TCCCACTTGC 7980 
GCCAACCTAA TGTGGTTCAA CTCAGCTGGC 8050 
AGTTCTAGGG TACATGTGCA CGACGTGCAG 8120 
CACCCATTAA CTCATCATTT ACATTAGGTA 8190 
GACAGGCCCT GGTGTGTGAT GTTCCCCACC 8260 
GTGAGAACAT GTGGTGTTTG GTTTTCTTTC 8330 
CCATGTCCCT ACAAAGGACA TGAACTCATC 8400 
CACATTTTCT TAATCCAGTC TATCATCGAT 8470 
GTGCCGCAAT AAACATACGT GTGCATGTGT 8540 
CAGTAATGGG ATGGCTGGGT CAAATGGTAT 8610 
CACAATGGTT GAACTAGTTT ACACTCCCAC 8680 
CAGCAGTTAT TTTTTTATGA AAATAGTATC 8750 
CCTGCAGGCC ACACAGCCAT TTCTCTCGAA 8820 
CCAATTATAG CATGTACAGT GGATCAAGGT 8890 
TATGTAACAG AAACAAAAAT TTCTTGTACA 8960 
TGGCGGCACA CTGGTCAGCC CTCTGGGACA 9030 
CCTGAGGGTC ACACAGTGCA CCATGCCCAG 9100 
ACCACAGCTG CCATGCTGGT AAAGGGCACC 9170 
TTACCGTCTT CAGTTATTTT TCCCTAAGAG 9240 
TCAGCTGGCA CAGAATTGCA CAAGCTGATG 9310 
GCAGTTAACT GTAGAGAGCT CGTCTGTTGG 9380 
TTACTTTATT TATGGCTGTG TAAATTGTTT 94 50 
TAAAGTTAAC CTTGCTGTGT ATTTTCCCTT 9520 
GGTGACACCT CACCTCACCC ACGCGAAAAC 9590 
TCCACAGCCT GTGGGCTTTG CAGTTGAGCC 9660 
AAGTCCTCTC TCTCTGCCGG TGCTGGATCC 9730 
GCGCAGGGGC ACCTTCGGGA GGGAGTGGGT 9800 
CACACGTGGT GAGTGCAGGC GGTGACCTGG 9870 
GGGCCCCAGT GAGACCCCCA GGAGCTGTGC 9940 
GTGCACCTGA GCCTGCGGAG AGCAGGAGCT 10010 
CCTGCGTGGG GTTGTTTGGG ATCGGTGGGA 10080 
GATGGCTAGG AGTGGGTTTC AGAGTTGATT 10150 
TCAGCACAGG GGATTGTCCA ATGTGGTCCC 10220 
GTGCGATTTG ACGAGGGACG AGAAACCTTG 10290 
GGTGGTTTCA GGTGCTTTGC TGGGCTGTGT 10360 
CCAGGTCCAC CCTCCAGGGC CGCCCTGGGC 104 30 
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TGGGGGTATG CCTGGCGTTC CTTGTGCCGC AGCCCGGAGC 
AGATTCACTC GGGGGGAGCC CAGGTCCCAA GCAACTGAGG 
AGAGCAGACG GGGAACGCTG CTTCTGTGTG GCAAGTTCCT 
TGTATGTTGG GGTCCCACCG GGGGCAGAAC TCTGTCTCTG 
TGGCCACAGG GAGCTGGGAA TGCACCAGGG GAGCTGCGCA 
GAAGGGCAGG GGGACGCCCG GGGCCACAGC AGAGGCCGCA 
GAGGCTACCG GGCACAGGGG GGCTCCCTGA GCTGGGTGAG 
TTGACGTGAA GCTGACGACT GGTGTTGCCC AGCTCACAGC 
CAGAACCCTC CCCTTTGTCT AAAGCACAGC AGATGCCTTC 
TTGAGAAACG TCTTAAAAGA AGGTGGGATG GTGGCAATTT 
CAGATGAGTC TATAACGGGA TTGTGGTGTT GCCATGGGGA 
GGGGCTGCAC CTCCCATCTG AGTCCTGGCT GTCCCGGGTC 
GTCCTGCCCG GGAGACAGGG AAAGCACCCC GAAGTCTGGA 
CTGCCAGGCC CAGCACCCTG CTCCAAATCA CCACTTCTCT 
CAGGTTACCT CCTGGGTGAC GGCCCCGCAT CCTGGGGCTG 
CGAGGTGTCC CTGAGTATGG CTGCGTGGTG AACTTGCGGA 
AGGCCCTGGG TGGCACGGCT TTTGTTCAGA TGCCGGCCCA 
GGATACCCGG ACCCTGGAGG TGCAGAGCGA CTACTCCAGG 
GCCCGGCTGG GGCAGGTGCT GCTGCAGGGC CGTTGCGTCC 
CCAATCCCAA AGGGTCAGAG GCCACAGGGT GCCCCTCGTC 
CTGTGGGAGT GAGGGTGCTC ACAACGGGAG CAGTTTTCTG 
AGACCTGGGT GCACTGAGGT GTCTTCAGAA AGCAGTCTGG 
GGCGTGAGTC TCTCAAACCC GAACACAGGG GCCCTGCTGG 
GGCCCTGCTG GGCGTGAGTC TCTCCGAACC CAGAGACTTC 
GTGAGCCCCA CACTCCAAGG CTCATCCACA GTCTACAGGA 
TCAGGGGACA GGGCCATGGT GTGGGGGGGG TCTCTACAAA 
GAGCTCAAGG CCCCGTCTCA GGCTCAGACA CAAATGAATT 
TGTTTCTTTT ATGAATAAAA AGTATCAACA TTCCAGGCAG 
ACTTTGGGAG GCCGAGGTGG GTGGATCACT TGAGGCCAGG 
AATTCCATTT CTACTTAAAA AATACAAAAA TTAGCCTGGC 
GCGGGAGGCT GAGGCAGGAG AATCATTTGA ACCCAGGAGG 
CTGCACTCCA GCCTGGGCAA CAGAGTGAGA CTTCATCTTA 
AACCATAGTG GACAGGTGTT TTTTTATTCT GTCCTTCGAT 
AACTGGGGGT GCCTTCCTCT GAAAGGCACA CCTTCATGGG 
CCAGAGGTTT AAACTGGGGT CCTGTCGTTC TGAGTTAACA 
ATGCTCCCTG GGGTTTGCTT CATGGGGGAG CAGCAGGTGT 
GCAGACGCCC TCATGATGGG GGAGTGGCAG GTGCAGACAC 
TGCAGCTCCC TCCCCACAAG GATGCCGGTC TCCTGTGCTC 
TACCTGGTCC TGGCCTCCAC TGGCTTTGTC TGCATGATTT 
GCCTCTCCCA GGCACCTCTG CAGTGCTGGC CATACCAGTC 
CCCCATGAAA TGTATTTTTT AGGACAGGCA CCCCTGGTTC 
TTGAAGGACA AAGGACAGAC AAACAAATCA GGAAAATGGG 
GGCTAGTGCA GGATGGGTGG GCATCAGGTC ATCAGATGTG 
AAGGCCACTT GGTCAGAGTG TGTGCTTGCA GAGGTGGCTC 
CCATACTCAG GGTGAACTCA CATCCTCTGT GTCTGAAGTA 
AAGAAAACAG GCAAAATGAT TAAGAAAAGT GAAAAAGGAA 
ATTTTAGTCT CCCAAACCAC AGCTCAGATG GTAGAATGTG 
AAACGGAAGC CCTATCTCTC AGAAACGTGT GTTAATGTGG 
TGTGTGTAAT TTTTTTTTCT GAGAAAACTG ACTGGAAGCA 
AGCAGATTCT AGGTAGAAGA GGAGACACAT GCAAACAACA 
AGGGAAGGGA GGTGAACGTT CCCTGGTTTG GTGTTGGGGA 
GAGGCAACGG GCATTGCTTT CACTGCAGAG AAACTCAGCT 
CTGGAGCGTT TGTGCACGTG ATTTATTTAA GGCGCCCTGT 
TTCTCCTAAC CACCTGAGAG GTAGAGGAGG AAAGGCTCCA 
GCAAAGGGCA TGCATGATTG CAGCCTGGCC TCCTGCTCCG 
AAGTCAGACC CATAGGCTCA GGGTGAGCCG GAGCCCAAGG 
TGGACGTCTG ATGCACACTT GGGAAGGTCC TACCAGCAGC 
AGACCCATCC CTCAAAGAAA CGCACGTGAA ACTGATGGCG 
TTTTCTGGGC TTGCCAAGAG CCAGCATCAG GTTGAGGCAA 
TTTGCATGGA AGTCCTCACA ATGTCCTGTG TCTTCCCAGT 
CACGGGTCTT ATTTACCATT TCCAGTGTTC CAGGCAGGGG 
AAATACAGGG CTAAGGAGAT ATTATGCATC ACAAAACTTG 
TTGAAGAATG TTTAATGGCA CAAAACGTTT ATTTCAATGT 
ACACCCCAGG AGCCTGCCGT GAATGTCATG TGTGTTCATC 
GGTGGTGAGG CCCTGGAGGA CATCGGTGGG ATGCCTCCAT 
CGTGCACTCA CTGGAGCCCT GTTTAGCTGG TGCCACCTGG 
AGATTCCCCA CGCCCAACTC AGTGTTCTCC CACAAAAAAC 
GCCCGGGAGC CAGGGCTCCA CAGTTTATTA TGTGTTTTTG 
GATGATGAGT GCACAAACAC GGCCGTGCGA GGTTTGGATA 
AGTTTGGTCA TGCAGAGTCT GGATGGCATG TAGCATTTGG 
GGCTGCAGCG CATGCCCCAG GCAGGACAAG GAAGCGGGAG 
GCAGGAGGGG GCTGGGTGTG GGGCAGGCAC CTGTGTCTGA 
ACCTCCATCA GAGCCAGTCT CACCTTCAAC CGCGGCTTCA 
TTGGGGTCTT GCGGCTGAAG TGTCACAGCC TGTTTCTGGA 
AGAGTTCAGA GTTCAGGAGG TGTGTGCGCA AGTATGTGTG 
ATGGTGACTG GCTGCACGTA AGAGTGCACA TGTACGCATA 
TGTACATGAA GGCATGGCAG TGTGTGCACA GGTGTGCAAG 



ACAGCAGGCT GTGCACATTT AAATCCACTA 10500 

GCTCAGGAGT CCTGAGGCTG CTGAGGGGAC 10570 

GAGGGTGCTG GCCAGGGAGG TGGCTCAGAG 10640 

ATGAGTCGGC AGCCATGTAA CAGGAAGGGG 10710 

GCTGGCCGAG GTCCCAGGGC CAGGCCACAG 10780 

GGAAGGGAAG GGGATGCCCA GGCCAGAGCA 10850 

CGAGGCTCAT GACTCGGCGA GGGAACCTCC 10920 

CCAGCCAGGT CCCGCGCCTG AGCAGGAACT 10990 

AGGGCATCTA GGAGAAAACA GGCAAAGTCG 11060 

CTTGTCCAGA TTTTAGTCTG CCCCGGACCA 11130 

CACATGAGAT GGACCATCAC AGAGGCCACT 11200 

CAGGCCAGGT TCTTGCATGC TCACCTACCT 11270 

GCAGGGCTGG GTCCAGGCTC CTCAGAGCTC 11340 

GGGGTTTTCC AAAGCATTTA ACAAGGGTGT 11410 

ACATTGCCCC TCTGCCTTAG GACCCTGGTC 11480 

AGACAGTGGT GAACTTCCCT GTAGAAGACG 11550 

CGGCCTATTC CCCTGGTGCG GCCTGCTGCT 11620 

TGAGCGCACC TGGCCGGAAG TGGAGCCTGT 11690 

ACCTCTGCTT CCGTGTGGGG CAGGCGACTG 11760 

CCATCTGGGG CTGAGCAGAA ATGCATCTTT 11830 

TGCTATTTTG GTAAAAGGAA ATGGTGCACC 11900 

ATCCGAACCC AAGACGCCCG GGCCCTGCTG 11970 

GCATGAGTCC CTCTGAACCC GAGACCCTGG 12040 

AGGGCCCTTT TGGGCGTGAG TCTCTCCGCT 12110 

TGCCATGAGT 7CATGATCAC GTGTGACCCA 12180 

ATTCTGGGGT CTTGTTTCCC CAGAGCCCGA 12250 

GAAGATGGAC ACAGATGCAG AAATCTGTGC 12320 

GGCAAGGTGG CTCACACCTA TAATCCCAGC 12390 

AGTTTGAGGC CAACCTAACC AACATAGTGA 124 60 

CTGGTGGCAC ACGCCTGTAG TCCCCGCTAT 12530 

CAGAGGTTGC AGTGAGCCGA GATCACACCA 12600 

AAAAAAAAAA AAAAAGTATC AGCATTCCAA 12670 

AATATTTACT GGTGCTGTGC TAGAGGCCGG 12740 

AAGAGAAATA AGTGGTGAAT GGTTGTTAAA 12810 

GTCCAGATCT GGACTTTGCC TCTTTCCAGA 12880 

GGACACCCTC GTGATGGGGG AGCAGCAGGT 12950 

CCTTGTGCAT GGTGCCCAGC ATGTCCCTGT 13020 

CCCACAGTCC CTGCTTCCCT CTCACAGCCT 13090 

CCACATTTCC TGGGCTCCCA GCACCTCTTC 13160 

AGCTGTGAAC TGTCCACTGC TTATTTTGCT 13230 

CAGCCTCTGG C AC AG CATC A GTGAATGTTA 13300 

TTCTCTCTAA ACACATTGCA AAGCCACAGA 13370 

GGTCCAATGC CAGAATATTC TGTGCTCCCA 13440 

TAAAAGCTCA GCAGTGGAGG CAGTGGTTCG 13510 

TACAGCAGAG GCTTGAAGGG CATCTGGGAG 13580 

AAGTGGTAAG ATGGGAATTT TCTTGTCCAG 13650 

GTCAGAACTG ATGGACAGAA CAATAGAACA 13720 

TATGTGGCAC AGCTGATGGA AAAGAGAGTG 137 90 

AATAAGTTGT GTCTTTACAG CATATACCAG 13860 

CCAGCAACAG AAATAAAACA AAAGACTCAA 13930 

AGGACACACA GGGAGGCGGA TGAAACCAGT 14000 

TGCCTGAGCC ACAGTGAAAA TGGCCATTCC 14070 

GAGGTCCTGC ACATTCATCC TCTCACTTTG 14140 

GGGGAGCAGC CGCCCTTGGT CACCCAGCTG 14210 

GGGCCCTTGC TCTGCCCGAG GACCCCACAC 14280 

TCGTGTTGGG GATGGCTGTG AAAGAAGAAA 14350 

GTCAAAGAAA TGCATGTGAA ACTGACAGCG 14420 

AGACCTGTCC CCATCCCTCA TGCTGGCTCC 14490 

GCTGGAAAGA CTTTTCTGGA AAGCAGCTTG 14560 

AATTCCACTT CTGAAGTGAC C AG AC ATT AT 14 630 

GACTTGCCAC AGCAAGTCAC GAACCTGCCC 14700 

CTCTGCCATT AAACATTTTT CAAAGAATTT 14770 

AGCAGTGTTC AAAGCTGGAT GTAAAAGAAC 14840 

TTTGGACATG GACATACATG GGCAGTGAGT 14 910 

CCTGCCCCTC TGGAGACACC ATGTGTGCCA 14980 

CTCTTCCATC CCTGAGATTC AAACACAGTG 15050 

CTGAGTCACA CCTGTGTTCA CTCGAGGGAC 15120 

GCTGAGTTAT GTGCAGATCT CATCAGGGCA 15190 

CACTCAACAT CACTAGCCAG GTCCTGGTGG 15260 

AGTCCATGGA GTGAGCACCC AGCCCCCTCG 15330 

GAAGGCAGGA GGCTCTTTGG AGCAAGCTTT 15400 

CATTCCCCCC TGTGTCTCAG CTATGCCCGG 15470 

AGGCTGGGAG GAACATGCGT CGCAAACTCT 15540 

TTTGCAGGTG AGCAGGCTGA TGGTCAGCAC 15610 

TGTGTGTGTG CGCGCGTGCC TGCAAGGCTG 15680 

TACACGTGAG CACATACATG TGTGCATGTG 15750 

GGCACAAGTG TGTGCACATG CGAATGCACA 15820 
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CCTGACATGC ATGTGTGTTC GTGCACAGTC GTGTGGGCAT TCACGTGAGG TGCATGCGTG TGGGTGTGCA 15890 
GTGTGAGTAG CATGTGTGCA CATAACATGT ATTGAGGGGT CCTCGTGTTC ACCCCGCTAG GTCCTCAGCA 15960 
CCAGTGCCAC TCCTTACAGG ATGAGACGGG GTCCCAGGCC TTGGTGGGCT GAGGCTCTGA AGCTGCAGCC 16030 
CTGAGGGCAT TGTCCCATCT GGGCATCCGC GTCCACTCCC TCTCCTGTGG GCTTCTGTGT CCACTCCCCC 16100 
TCTCCTGTGG GCATTTACAT CCACTCCACT CCCTCTCTCC TGTGGGCATC CGCGTCCACT CCCCCTCTCT 16170 
GTGGGCATCT GCGTCCACCT CCCCTCTCTG TGGGCATTTG CGTCCACTCC CTCTCCTGGT TCCTTCCTGT 16240 
CTTGGCCGAG CCTCGGGGGC AGGCAGATGA CACAGAGTCT TGACTCGCCC AGGGTGGTTC GCAGCTGCCG 16310 
GGTGAGGGCC AGGCCGGATT TCACTGGGAA GAGGGATAGT TTCTTGTCAA AATGTTCCTC TTTCTTGTTC 16380 
CATCTGAATG GATGATAAAG CAAAAAGTAA AAACTTAAAA TCCCAGAGAG GTTTCTACCG TTTCTCACTC 16450 
TTTCTTGGCG ACTCTAGGTG AACAGCCTCC AGACGGTGTG CACCAACATC TACAAGATCC TCCTGCTGCA 16520 
GGCGTACAGG TGAGCCGCCA CCAAGGGGTG CAGGCCCAGC CTCCAGGGAC CCTCCGCGCT CTGCTCACCT 16590 
CTGACCCGGG GCTTCACCTT GGAACTCCTG GGTTTTAGGG GCAAGGAATG TCTTACGTTT TCAGTGGTGC 16660 
TGCTGCCTGT GCACAGTTCT GTTCGCGTGG CTCTGTGCAA AGCACCTGTT CTCCATCTCT GGGTAGTGGT 16730 
AGGAGCCGGT GTGGCCCCAG GTGTCCCCAC TGTGCCTGTG CACTGGCCGT GGGACGTCAT GGAGGCCATC 16800 
CCAGGGCAGC AGGGGCATGG GGTAAAGAGA TGTTTATGGG GAGTCTTAGC AGAGGAGGCT GGGAAGGTGT 16870 
CTGAACAGTA GATGGGAGAT CAGATGCCCG GAGGATTTGG GGTCTCAGCA AAGAGGGCCG AGGTGGGTGC 16940 
AGGTGAGGGT CGCTGGCCCC ACCCCCGGGA AGGTGCAGCA GAGCTGTGGC TCCCCACACA GCCCGGCCAG 17010 
CACCTGTGCT CTGGGCATGG CTGTGCTCCT GGAACGTTCC CTGTCCTGGC TGGTCAGGGG GTGCCCCTGC 17080 
CAAGAATCGA CAACTTTATC ACAGAGGGAA GGGCCAATCT GTGGAGGCCA CAGGGCCAGC TTCTGCCTGG 17150 
AGTCAGGGCA GGTGGTGGCA CAAGCCTCGG GGCTGTACCA AAGGGCAGTC GGGCACCACA GGCCCGGGCC 17220 
TCCACCTCAA CAGGCCTCCC GAGCCACTGG GAGCTGAATG CCAGGAGGCC GAAGCCCTCG CCCCATGAGG 17290 
GCTGAGAAGG AGTGTGAGCA TTTGTGTTAC CCAGGGCCGA GGCTGCGCGA ATTACCGTGC ACACTTGATG 17360 
TGAAATGAGG TCGTCGTCTA TCGTGGAAAC CCAGCAAGGG CTCACGGGAG AGTTTTCCAT TACAAGGTCG 174 30 
TACCATGAAA ATGGTTTTTA ACCCGAGTGC TTGCGCCTTC ATGCTCTGGC AGGGAGGGCA GAGCCACAGC 17500 
TGCATGTTAC CGCCTTTGCA CCAGCTCCAG AGGCTTGGGA CCAGGCTGTC TCAGTTCCAG GGTGCGTCCG 17570 
GCTCAGACCG CCCTCCTCTC TGCCTTCTCT CTCTGCCTCA AATCTTCCCT CGTTTGCATC TCCCTGACGC 17640 
GTGCCTGGGC CCTCGTGCAA GCTGCTTGAC TCCTTTCCGG AAACCCTTGG GGTGTGCTGG ATACAGGTGC 17710 
CACTGAGGAC TGGAGGTGTC TGACACTGTG GTTGACCCCA GGGTCCAGCT GGCGTGCTTG GGGCCTCCTT 17780 
GGGCCATGAT GAGGTCAGAG GAGTTTTCCC AGGTGAAAAC TCCTGGGAAA CTCCCAGGGC CATGTGACCT 17850 
GCCACCTGCT CCTCCCATAT TCAGCTCAGT CTTGTCCTCA TTTCCCCACC AGGGTCTCTA GCTCCGAGGA 17920 
GCTCCCGTAG AGGGCCTGGG CTCAGGGCAG GGCGGCTGAG TTTCCCCACC CATGTGGGGA CCCTTGGGTA 17990 
GTCGCTTGAT TGGGTAGCCC TGAGGAGGCC GAGATGCGAT GGGCCACGGG CCGTTTCCAA ACACAGAGTC 18060 
AGGCACGTGG AAGGCCCAGG AATCCCCTTC CCTCGAGGCA GGAGTGGGAG AACGGAGAGC TGGGCCCCGA 18130 
TTTCACGGCA GCCAGGCTGC AGTGGGCGAG GCTGTGGTGG TCCACGTGGC GCTGGGGGCG GGGTCTGATT 18200 
CAAATCCGCT GGGGCTCGGC CTTCCTGGCC CGTGCTGGCC GCGCCTCCAC ACGGGCTTGG GGTGGACGCC 18270 
CCGACCTCTA GCAGGTGGCT ATTTCTCCCT TTGGAAGAGA GCCCCTCACC CATGCTAGGT GTTTCCCTCC 18340 
TGGGTCAGGA GCGTGGCCGT GTGGCAACCC CGGGACCTTA GGCTTATTTA TTTGTTTAAA AACATTCTGG 18410 
GCCTGGCTTC CGTTGTTGCT AAATGGGGAA AAGACATCCC ACCTCAGCAG AGTTACTGAG AGGCTGAAAC 18480 
CGGGGTGCTG GCTTGACTGG TGTGATCTCA GGTCATTCCA GAAGTGGCTC AGGAAGTCAG TGAGACCAGG 18550 
TACATGGGGG GCTCAGGCAG TGGGTGAGAT GAGGTACACG GGGGGCTCAG GCAGTGGGTG AGGCCAGGTA 18620 
CATGGGGGGC TCAGGCACTG GGTGAGATGA GGTACACGGG GGGCTCAGGC AGAGGGTCAG ACCAGGTACA 18690 
CGGGGGCTCT GATCACACGC ACATATGAGC ACATGTGCAC ATGTGCTGTT TCATGGTAGC CAGGTCTGTG 18760 
CACACCTGCC CCAAAGTCCC AGGAAGCTGA GAGGCCAAAG ATGGAGGCTG ACAGGGCTGG CGCGGTGGCT 18830 
CACACCTGTA GTCCCAGCAC TTTGGGAGGC CGAGGCGAGA GGATCCCTTG AGCCCAGGAG TTTAAGACCA 18900 
GCCTGAGCAA CATAGTAGAA CCCCATCTCT ATGAAAAATA AAA AC AAAAA TTAGCTGAAC ATGGTGGTGT 18970 
GCGCCTGTAG TTCCAATACT TGGGAGGCTG AAGTGGGAGG ATCACTTGAG CCCAGGAGGT GGAAGCTGCA 19040 
GTGAGCTGAG ATTGCACCAC TGTACTGCAG CCTGGGTGAC AGAGTGAGAG CCCATCTCAA CAACAACAAA 19110 
GAAGACTGAC AAATGCAGTT TCTTGGAAAG AAACATTTAG TAGGAACTTA ACCTACACAC AGAAGCCAAG 19180 
TCGGTGTCTC GGTGTCAGTG AGATGAGATG ATGGGTCCTC ACACCATCAC CCCAGACCCA GGGTTTATGC 19250 
ACCACAGGGG CGGGTGGCTC AGAAGGGATG. CGCAGGACGT TGATATACGA TGACATCAAG GTTGTCTGAC 19320 
GAAGGGCAGG ATTCATGATA AGTACCTGCT GGTACACAAG GAACAATGGA TAAACTGGAA ACCTTAGAGG 19390 
CCTTCCCGGA ACAGGGGCTA ATCAGAAGCC AGCATGGGGG GCTGGCATCC AGGATGGAGC TGCTTCAGCC 194 60 
TCCACATGCG TGTTCATACA GATGGTGCAC AGAAACGCAG TGTACCTGTG CACACACAGA CACGCAGCTA 19530 
CTCGCACACA CAAGCACACA CACAGACATG CATGCATGCA TCCGTGTGTG TGCACCTGTG CCCATGAGGA 19600 
AACCCATGCA TGTGCATTCA TGCACGCACA CAGGCACCGG TGGGCCCATG CCCACACCCA CGAGCACCGT 19670 
CTGATTAGGA GGCCTTTCCT CTGACGCTGT CCGCCATCCT CTCAGGTTTC ACGCATGTGT GCTGCAGCTC 19740 
CCATTTCATC AGCAAGTTTG GAAGAACCCC ACATTTTTCC TGCGCGTCAT CTCTGACACG GCCTCCCTCT 19810 
GCTACTCCAT CCTGAAAGCC AAGAACGCAG GTATGTGCAG GTGCCTGGCC TCAGTGGCAG CAGTGCCTGC 19880 
CTGCTGGTGT TAGTGTGTCA GGAGACTGAG TGAATCTGGG CTTAGGAAGT TCTTACCCCT TTTCGCATCA 19950 
GGAAGTGGTT TAACCCAACC ACTGTCAGGC TCGTCTGCCC GCCCTCTCGT GGGGTGAGCA GAGCACCTGA 20020 
TGGAAGGGAC AGGAGCTGTC TGGGAGCTGC CATCCTTCCC ACCTTGCTCT GCCTGGGGAA -GCGCTGGGGG 20090 
GCCTGGTCTC TCCTGTTTGC CCCATGGTGG GATTTGGGGG GCCTGGCCTC TCCTGTTTGC CCTGTGGTGG 20160 
GATTGGGCTG TCTCCCGTCC ATGGCACTTA GGGCCCTTGT GCAAACCCAG GCCAAGGGCT TAGGAGGAGG 20230 
CCAGGCCCAG GCTACCCCAC CCCTCTCAGG AGCAGAGGCC GCGTATCACC ACGACAGAGC CCCGCGCCGT 20300 
CCTCTGCTTC CCAGTCACCG TCCTCTGCCC CTGGACACTT TGTCCAGCAT CAGGGAGGTT TCTGATCCGT 20370 
CTGAAATTCA AGCCATGTCG AACCTGCGGT CCTGAGCTTA ACAGCTTCTA CTTTCTGTTC TTTCTGTGTT 204 40 
GTGGAAATTT CACCTGGAGA AGCCGAAGAA AACATTTCTG TCGTGACTCC TGCGGTGCTT GGGTCGGGAC 20510 
AGCCAGAGAT GGAGCCACCC CGCAGACCGT CGGGTGTGGG CAGCTTTCCG GTGTCTCCTG GGAGGGGAGC 20580 
TGGGCTGGGC CTGTGACTCC TCAGCCTCTG TTTTCCCCCA GGGATGTCGC TGGGGGCCAA GGGCGCCGCC 20650 
GGCCCTCTGC CCTCCGAGGC CGTGCAGTGG CTGTGCCACC AAGCATTCCT GCTCAAGCTG ACTCGACACC 20720 
GTGTCACCTA CGTGCCACTC CTGGGGTCAC TCAGGACAGG CAAGTGTGGG TGGAGGCCAG TGCGGGCCCC 20790 
ACCTGCCCAG GGGTCATCCT TGAACGCCCT GTGTGGGGCG AGCAGCCTCA GATGCTGCTG AAGTGCAGAC 20860 
GCCCCCGGGC CTGACCCTGG GGGCCTGGAG CCACGCTGGC AGCCCTATGT GATTAAACGC TGGTGTCCCC 20930 
AGGCCACGGA GCCTGGCAGG GTCCCCAACT TCTTGAACCC CTGCTTCCCA TCTCAGGGGC GATGGCTCCC 21000 
CACGCTTGGG AGCCTTCTGA CCCCTGACCT GTGTCCTCTC ACAGCCTCTT CCCTGGCTGC TGCCCTGAGC 21070 
TCCTGGGGTC CTGAGCAAGT TCTCTCCCCG CCCCGCCGCT CCAGCGTCAC TGGGCTGCCT GTCTGCTCGC 21140 
CCCGGTGGAG GGGTGTCTGT CCCTTCACTG AGGTTCCCAC CAGCCAGGGC CACGAGGTGC AGGCCCTGCC 21210 
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TGCCCGGCCA 
ATTTTGGCCC 
CGCAGCCAAC 
GCCGAGAGCA 
CCAGGCCCGC 
GCTGAGTGTC 
CACTTCCCCA 
CTCCCCACAT 
CCACCCCCAC 
GTGTGCCCTG 
GCTGTGGGAG 
GTGCACTGCA 
GCCCATGGCC 
CCTGGCTGGG 
GAGCCCCCAC 
TTGGGCGGCG 
GGGGTGATGG 
GCCTCCCACC 
GGAGGTGGGG 
TCAGGTTGAA 
GTGGGTAGGG 
TCCTCTTATC 
TCTCCCAGTC 
CATCCAGACT 
GAAGGAACTG 
AGCCCCTCCT 
CAGCAGGTCC 
TTTGAGTGCA 
TGCTGCTGCT 
GTCGTAAATG 
GGCCTGGGGG 
GTGAGAGGTT 
TGAATCACAG 
CTCCGGGTGT 
AAAAGGTATT 
T ATT ATT ATT 
GCTGTAGCCG 
TGTGAGCCAC 
CTGTCATCCC 
GGTAACATAG 
AGTCCCAGCT 
TGATTGTACC 
AAGGAGAAGG 
AAGGAGGCCT 
GGAAAGAAAA 
ACAAGCGTGT 
GTGACACCAG 
TGCACCTGCT 
CAAACTTTGG 
CCCACGTCCT 
AATCACGGCT 
GGTCCCTAGA 
GCTGGCTTTG 
AGCAATCCTC 
TCAGCTTTCC 
ACAGCAGCAA 
CCCCTGGG 



CCCACACGTC 
CGCAGCCCAG 
CCGGCACTGC 
GACACCAGCA 
ACCGCTGGGA 
CGGCTGAGGC 
CAGGCTGGCG 
AGGAATAGTC 
CATCCAGGTG 
TACACAGGCG 
TAAAATAGTG 
TAGACACCAC 
TGGCTGTGCA 
CCTGGGAGGT 
CCTGGAAGAC 
GGGATGATGG 
GGGGGGCTGG 
TGCAGCCGTG 
GGCAGGGGCA 
AGTCACATTC 
TGGGGCAGTG 
ATCTCCCAGT 
TCATCTGTCA 
TACCTCCCAG 
GAAGGATTGC 
CAGAAGTTGG 
CTGGTGGGGC 
GCCCGGACGT 
TCAGAGAATG 
CACTCTGGTG 
CGCCTTTGCC 
GGACAGAACA 
ACCAACaGGT 
TTTTTGTTGA 
TGCTTTGATA 
ATTAGAGATG 
CAAACCCCCA 
TGCCCTTGCC 
AGTAGTTTGG 
GGAGACCCCA 
GCTCGGGAGG 
ATCGCACTCC 
AGAAGAGAAG 
GCTAGGTGCT 
ACCCCAGCTC 
ATGGAGCGAG 
CCAGGACCCC 
GTAACCGTCG 
TGGGTTTCAG 
TCTCCTGGAA 
GCCAGTCAGC 
AGTGAGAGAG 
AGATGGAGGA 
CCCGGTCCTG 
GGCCTCCAGA 
ATGGAATAGC 



CTAGGAGGGT 
ACGCAGCTGA 
CCTCAGACTT 
GCCCTGTCAC 
GTCTGAGGCC 
CTGAGCGAGT 
CTCGGCTCCA 
CATCCCCAGA 
GAGACCCTGA 
AGGACCCTGC 
AATATATGAG 
TGTATGCAAT 
TTTACGGAAG 
TTCTGATGCT 
ATAACAGTAA 
AGGGCCTGGC 
TCTGGGTGGC 
GATCCGGATG 
TGACACCATC 
CGCCTCTGGC 
GAGGGTGTGG 
CTCATCTCTC 
TCCTCTTACC 
GGCGGGTGCC 
AGAGAACAGG 
CTTGGGCCAC 
CTTATGGTAT 
GCCTGGTGTC 
TCTGAGTGAC 
CCTGGAGCCC 
CTGCAAACTG 
GGGCGGGGAC 
CAGGCCATTG 
AATTTTACTC 
TGGCTTAACT 
GTGTCTACTC 
GGCTCAAGTG 
TGGCACTTTT 
GAAGCCGAGG 
TCTCTACAAA 
CTGAGTGGGA 
AGCCTGGGCA 
AAGAAGGAAG 
AGGTAGACTG 
TTTGGACTTC 
TGAGTTCAAA 
TGAAAGGGAG 
ATGTTGGTGC 
AAGCCCCAGG 
CCTGTGAATG 
CGATCTTAAG 
GGAGGCAGGG 
GGGGGTCCCC 
AGGGCACACG 
GCTGTAAGAT 
AGTACAGGGA 



TGGAGGATGC 
GTCGGAAGCT 
CAAGACCATC 
GCCGGGCTCT 
TGAGTGAGTG 
GTCCAGCCAA 
CCCCAGGGCC 
TTCGCCATTG 
GAAGGACCCT 
ACCTGGATGG 
TTTTTCAGTT 
TACAGAAGCC 
TCTATGAGTG 
GTGAGGCAGG 
GTCCAGGCCC 
C AGGGTGGC A 
GGGGAAGATG 
TGCTTCCCTG 
CTGTATAAAA 
CATTCTCTTA 
ACACAGGAGG 
ATCCTCTTAT 
ATCTCCCAGT 
AGGCTCGCAG 
AGGGGCGGCT 
ACGAAACCGA 
GGCCGGGTCC 
GGGGTGGGGG 
CGAGCCTAAT 
CCGTATAGGA 
GAAGGGAGCG 
TTCCCAGGAG 
TTCAGCTATC 
AGGATTACTT 
CACTAAGCAC 
TGTCACCCAG 
ATCCTCCGGC 
AAAAACCACT 
CAGAAGGATT 
AAATGCAAAA 
GGATCGCTTG 
ACAGAGTGAG 
AAGGAAAGAG 
TCAAATCTCA 
CTTAGGCCTG 
GCAGAAAGGG 
TGGTTGTTTT 
CAGGTGCCCA 
CACTTGTGGC 
TGTCACCCGC 
GTCATCCTGG 
GAGAGTCAGA 
AGCCAAGGAA 
GCCCTGCCCA 
GATGCGTTTG 
AATGAATACA 



CACCTCTGGC 
CCCGGGGACG 
CTGGACTGAT 
ACGTCCCAGG 
TTTGGCCGAG 
GGGCTGAGTG 
AGCTTTTCCT 
TTCACCCCTC 
GGGAGCTCTG 
GGGTCCCTGT 
TTGAAAAAAA 
TGTGAGTGAA 
AATGGGGTTG 
AGGGGAAGGA 
GAAGGGCAGC 
GGGATGATGG 
GGGAAGCCTG 
GTGCACATCC 
TCCAGGATTC 
AGAGTAGACC 
CTTCAGGGTG 
CATCTCCCAG 
CTCATCTCTT 
TGGAGCTGGA 
CAGAGGGACG 
GGGCCCTGCG 
TACTGAGTGC 
CTTATGGCCA 
GTGTATGGTG 
GCTGTGAGGA 
GCCCCGGGCG 
CAGAGGCCGC 
CATCTTCTAC 
ATATTTTTTG 
CTACTTTATT 
GTTGTTAGTG 
CTCAGCTTCC 
ATGTAAGGTC 
GTCTGAGGCC 
AGTTATCCGG 
AGCCCGGGAG 
ACCCTGTCTC 
AAGAAGAAGG 
GAGCAAAATG 
AACTTCATCT 
AGGAGAAGCA 
CCTGCCTCAG 
CCTGGGAAGG 
AGGCACAATT 
AAGGCAGAGG 
ATTATCTGGT 
GAGGGGACGT 
TGGGGGCAGC 
CGCCTCGATT 
TGTTCAGCCA 
GGGACAGTTC 



CTCTTCTGGA 
ACGCTGACTG 
GGCCACCCGC 
GAGGGAGGGG 
GCCTGCATGT 
TCCAGCACAC 
CACCAGGAGC 
GCCCTGCCCT 
GGAATTTGGA 
GGGTCAAATT 
TCTCATGTTT 
CGGGGTGGTG 
TGGTCAGTGC 
GGGTAGGGGA 
AGGGATGCTG 
GGGCCCCAGC 
GCTGGGCCCC 
TCTGGGCCAT 
CTCCTCCTGA 
AGGATTCTGA 
GGGCTGGTGA 
TCTCATCTGT 
ATCCTCTTAT 
CATACGTCCT 
CAGTCTTGGG 
TGAGTGGCTC 
ACCTTGGACA 
CTGGATATGG 
GGCCCAAGTC 
AGGAGGGGCT 
CCGTGGGCGG 
TGCTCAGGCA 
AAAGCTCCAG 
CTAAAGTATT 
TGTCTGTTTT 
CAGTGGCACA 
CAGAGTGCTG 
AGGTCCAGTG 
AGGAGTTTGA 
GCGTGGGGTC 
GTCATGGCTG 
AAAAAAAAAA 
AAGAAGGAAG 
AAAATAACAA 
CAAGCAGCTT 
GGCAAGGGTG 
CCCCACGCTC 
ATGCTGTGCA 
ACAGCCCCTC 
CTGGTGAAGG 
GGGCCTGATA 
GAGAAGGACC 
CGCTCCATGC 
TCAGGCCAGT 
CTAAGCTGCA 
TCAGAGTGAC 



ACGGAGTCTG 
CCCTGGAGGC 
CCACAGCCAG 
CGGCCCACAC 
CCGGCTGAAG 
CTGCCGTCTT 
CCGGCTTCCA 
CCTTTGCCTT 
GTGACCAAAG 
GGGGGGAGGT 
GAATCCTAAT 
GTCAGTGCGG 
GGGCCCATGG 
TAGACAGTGG 
GGGGCCCAGC 
TGGGGTGGCA 
CTCCTCCCCT 
CAGCTTTCAT 
ACGCCCCAAC 
TCTCTGAAGG 
TGCTCTCTCA 
CTTCCTCTTA 
CTCCTAGTCT 
TCCTCAGGCA 
GTGAAGAAAC 
CAGAGCCTTC 
GGGCTTCTGG 
CGTCATTTAT 
CACAGACTGT 
CTTGGCAGCC 
ACGACCTCAA 
CACCTGGGTT 
ATTCCTGTTT 
AGACCCTTAA 
TATTTATTAT 
GTCATGGCTC 
GG ATT AC AGG 
GCTTCCACAC 
GACCAGCATG 
CAGCATCTGT 
CAGTGAGCTG 
AAAAAAAAAG 
AAAGAAGGAG 
AGTTTTAAAG 
CCTTCCACAG 
GAGGCTGTGG 
CTGCCGGTCC 
GGGGGCTTGC 
CCCAAAGATG 
CTGCAGGTGG 
TGGCCACAAG 
ACTGGCCACT 
TGGAAAAGCA 
GGGACCTGTT 
GTGATTCGTC 
TCTCAGCCCA 



21280 
21350 
21420 
21490 
21560 
21630 
21700 
21770 
21840 
21910 
21980 
22050 
22120 
22190 
22260 
22330 
22400 
22470 
22540 
22610 
22680 
22750 
22820 
22890 
22960 
23030 
23100 
23170 
23240 
23310 
23380 
23450 
23520 
23590 
23660 
23730 
23800 
23870 
23940 
24010 
24080 
24150 
24220 
24290 
24360 
24430 
24500 
24570 
24640 
24710 
24780 
24850 
24920 
24990 
25060 
25130 
25138 



Beispiel 5 



Der Vergleich der oben beschriebenen genomischen hTC-Sequenz mit der Sequenz 
der hTC-cDNA (Fig. 6; entsprechend SEQ ID NO 2) ermoglichte die Aufklarung der 
Exon-Intron-Struktur des hTC-Gens. Die genomische Organisation des hTC-Gens ist 
in Fig. 7 schematisch dargestelit. Die kodierende Region des hTC-Gens setzt sich aus 
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16 Exons zusammen, die in ihrer Grolie zwischen 62 bp und 1354 bp variieren (s. 
Tabelle 1). Exon 1 enthalt das Translationsstartcodon ATG. Das Translations- 
stopcodon TGA sowie der 3' untranslatierte Bereich liegen auf Exon 16 (Fig. 8). Ein 
mdgliches Polyadenylierungssignal (AATAAA) wurde weder in Exon 16 noch in 
5 den 3195 bp der folgenden 3'-flankierenden Region gefunden. Basierend auf der 
Konsensussequenz 



5'-Exon Intron 3'-Exori 

Pra-mRNA A/C A G I G T A/G A . . . N C A G | G 

10 Haufigk.(%) 70 60 80 lOO lOO 95 ^70 80 100 100 60 

wurden die Exon-Intron-Ubergange bestimmt und in Tabelle 1 aufgefuhrt. Mit 
Ausnahme der 5 6 -SpIice-Stelle zwischen Exon 15 und Intron 15 stimmen alle Exon- 
Intron-Ubergange mit der publizierten (Shapiro und Senapathy, 1987) Splice- 
15 Konsensussequenz iiberein. Die GroBe der Introns liegt zwischen 104 bp und 8616 
bp. Da Intron 6 nur zum Teil isoliert wurde, kann die exakte Lange des hTC-Gens 
nicht bestimmt werden. Basierend auf der von Intron 6 erhaltenen Teilsequenz von 
-4660 bp betragt die minimale GroBe des hTERT Gens 37 kb. 
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Die Introns 1-5 sowie der 5'-Bereich des Introns 6 sind in Contig 1 enthalten: 
Intron 1: bp 11493-1 1596 (SEQ ID NO 4); 
Intron 2: bp 12951-21566 (SEQ ID NO 5); 
Intron 3: bp 21763-23851 (SEQ ID NO 6); 
5 Intron 4: bp 24033-24719 (SEQ ID NO 7); 
Intron 5: bp 24900-25393 (SEQ ID NO 8); 
5'-Bereich von Intron 6: bp 25550-264 14 (SEQ ID NO 9). 

Der 3'-Bereich des Introns 6 sowie die Introns 7-15 sind in Contig 2 an folgenden 
10 Positionen lokalisiert: 

3'-Bereich von Intron 6: bp 1-3782 (SEQ ID NO 10); 

Intron 7: bp 3879-4858 (SEQ ID NO 1 1); 

Intron 8: bp 4945-7429 (SEQ ID NO 12); 

Intron 9: bp 7544-9527 (SEQ ID NO 1 3); 
15 Intron 10: bp 9600-1 1470 (SEQ ID NO 14); 

Intron 1 1 : bp 1 1 660-1 5460 (SEQ ID NO 15; 

Intron 12: bp 15588-16467 (SEQ ID NO 16); 

Intron 13: bp 16530-19715 (SEQ ID NO 17); 

Intron 14: 19841-20621 (SEQ ID NO 18); 
20 Intron 15: 20760-21295 (SEQ ID NO 19). 

Der 3'-nichttranskribierte Bereich befindet sich ebenfalls im Contig 2 an Position 
21960-25138 (SEQ ID NO 20). 



25 



Die genannten Introns haben im einzelnen folgende Sequenzen: 



WO 99/33998 



38 



PCT/EP98/08216 



Intron 1 (SEQ ID NO 4) 

GTGGGCCTCCCCGGGGTCGGCGTCCGGCTGGG^ 
CGACTCAGGGCGCTTCCCCCGCAG 

5 

Intron 2 (SEQ ID NO 5) 

GTGAGGAGGTGGTGGCCGTCGAGGGCCCAGGCCCCAGAGCTGAATC 
CTGGTCCTCCTGTCTCCATCGTCACGTGGGCACACGTGGCTTTTCGCTCAGGAC^ 
TCTGCTCTCCCTCCTGTCCAGTTTGCATAAACTTACGAGGTTCACCT^ 
1 0 CGAGGCCAGAGCAGTGAACAGAGGAGGCTGGGCGCGGCAGTGGAGCCGGGTTGCCGGCAATC 

CACAGACGCTCTGGCGAGGGTGCCTGCAGGTTACCTATAATCCTCTTCGCAATTTCAAGGGTGGGAATC 
CGAGAACCCCCTCTTCCTGGGGGTGGGAGGTAAGGGTTTTGCAGGTGCACGTC 

AGATTTAATTGTGTGTTGACGGCCAGGTGCGGTGGCTCACGCCGGTAATCCCAGCACTTTGGGAAGCTGAGGCAGGTGGA 
TCACCTGAGGTCAGGAGTTTGAGACCAGCCTGACCAACATGGTGAAACCCTATCTGTACTAAAAATACAAAAATTAGCT^ 
15 GGCATGGTGGTGTGTGCCTGTAATCCCAGCTACTTGGGAGGCTGMGCAGGAGAATCACTTGAACCCAGGAGGCGGAGGC 
TGCAGTGAGCTGAGATTGTGCCATTGTACTCCAGCCTGGGCXjAC^GAGTC 

CGTTGATTGTGCCAGGACAGGGTAGAGGGAGGGAGATAAGACTGTTCTCCAGCACAGATCCTGGTCCCATC^ 
GAAGAGGGCCA<^TGGGAGCAGAGGACAGCAGATGGCTCCACCTGCT 

ATGGTGCTGCTGGGCCCTGCCGTGTCCCCACCCTGTTTTTCTGGATTTGATGTTGAGGAACCTCCGCTCCAGCCCC 
20 TGGCTCCCAGTGCTCCCAGGCCCTACCGTGGCAGCTAGAAGAAGTCCCGATTTCACCCCCTCCCCACAA^ 
ATGTAAGACTTCCGGCCATGCAGACAAGGAGGGTGACCTTCTTGGGGCTC 
AAAAGTCATATAACATGAGATTGGCACTCCTAACACCGTTTTCTG 

CAGCAGGTTGCTTGAAATGCTGCGTCTTGCGTGACTGGAAGTCCCTACCCATCGAACGGCAGCTGCCTCACACCTGCTGC 
GGCTCAGGTGGACCACGCCGAGTCAGATAAGCGTCATGCAACCC^GTTTTGCTTTTTGTGCTCCAGCTTCCTTCGTTGAG 
25 GAGAGTTTGAGTTCTCTGATCAGGACTCTGCCTGTCATTGCTGTTCTCTGACTTCAGATGAGGTCACAATCTGCCCCTGG 
CTTATGCAGGGAGTGAGGCGTGGTCCCCGGGTGTCCCTGTCACGTGCAGGGTGAGTGAGGCGTTGC 
GTCACGTGTAGGGTGAGTGAGGCGCGGCCCCCGGGTGTCCCTGTCCCGTGCAGCGTGATTGAGGTGTGGCCCC^^ 
CCCTGTCACGTGTAGGGTGAGTGAGGCGCCATCCCCGGGTGTCCCTGTCACGTGTAGGGTGAGTGAGGCGTGGTCCCCOT 

GTGTCCCTGTCCCGTGCAGGGTGAGTGAGGCACTGTCCCOXX;^ 
30 CCGGGTGTCCCTCTCAGGTGTAGGGTGAGTGAGGCGCGGCCCCAGGGTGTCCCTGTCACGTGTAGGGTGAGTGAGGCACC 
GTCCCTGGGTGTCCCTCCCAGGTATAGGGTGAGTGAGGCACTGTCCCCGGGTGTCCCTGTCACGTGCAGGGTGAGTGA^ 
CGCGGCCCCCGGGTGTCCCTCTCAGGTGCAGGGTGAGTGAGGCGCTGTCCCTGGGTGTCCCTGTCTCGTGTAGG 
GAGGCTCTGTCCCCAGGTGTCCTTGGCGTTTGCTCACTTGAGCTTGCTCCTGAATGT^ 

GCGCCGGTTGCCGATTGCCTGGGTAGATGGTGCAGGCGCAGTGCTGGTCCCCAAGCCTATCTTTTCTGATGCTCGGCTCT 
35 TCTTGGTCACCTCTCCGTTCCATTTTGCTACGGGGACACGGGACTGCAGGCTCTCGCCTCCCGCG 
CCACAGCTTGAGGTCCGCTTGCCTCTGTTGGGCCTGGCTTGCTC^ 

TCTCCCAGCTTGTCTCATGCCGAGGCTGGACTCTGGGCTGCCTGTGTCTGCTGCCACGTGTTGCTGGAGACATCCCAGAA 
AGGGTTCTCTGTGCCCrcAAGGAAAGCAAGTCACCCCAGCCCCCTCACTTGTCC^ 
TTGGCCCCCTTGGGTGGGTGGCAACGCTTGTCACCTTATTCTG 
40 CCAGTCGCCCCCTCACATGGATTGACGTCCAGCCACAGGTTGGAGTGTCTCTGTCTGTCTCCTGCTCTGAGACCCACGTG 
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GAGGGCCGGTGTCrCCGCCAGCCTTCGTCAGACTTCCCTCTTGGGTCTTAGT^ 

TTTCTATCTCTCCATTGTATGCTTTTTCTTGGTTTATTC 

CCTCTAAGTGCTGCCTTACCTGCACCCTGTGTTTTGATGTGAAGTAATCTCAA 

ATACTTCAAAGTGTTAATACTTCTTTTAAGTATTCTTATTCTGTC 

AATCATTTTGATATCAGTCACTTTTAAGTATTCTTTAGCTTATT 

GTITATGTTCAAGATATGTAGAGTATCAAGATACGTAGAGTATTTTAAGTTATCATTTT 
TGTGTAGTGGTCTGTATAATACCAATTATTTGAAGT^ 

AACTGTCCATTGTAAATTTGACATCCTGTCAATAGTGGGCATGCATGTTCACT 

AAGCTTCTGTCTCCTTCTAGATGCATGAAATTCCAAGAAGGAGGCCATAGTCCCTCACCTC 

TCTTCTCGTTTGGTAGCATTTATGTGAGGCATTGTTAGGTGCATGCACGTGGTAG 

TCTTTTGGAGACTTCTATGTCTCTAGTAATCTA^ 

TTTGATTAGTATTTTCCTGCTGTGTCTGTTTTCTGCC^ 

GAGTCTTGGTCTGTCGCCCAGGGTGAGTGCAGTGGTGTGATCACA^ 

CCTCTCACCTGA£CCTCCTGAGTAGCTGGAACTGCAGAC^ 

GACAGGGTCTTGCTGTGTTGCCCAGGCTGGTCTCAAACTCTTC 

CTGAATTACAGGCATGAGCCACCATGTCTGGCCTAATTTTC^ 

ACAGCATGTAGGTGAATTTCCAATCCAGTCTGACAGTCGTTG 

ACTAGAGACCCGCCTGGTGCACTCTGATTCTCCACTTGCCTGTTGCATGTCCTC^ 

GGTTGCC^TGTGCGTTTCCTGCCGAGTGTGTGTTGATCCTCTCGTTGCCT 

CTTTGCITAGTGTTACCCCCreATCTTTTTATTGTCGTTGTTTGCTTT 

GG CTGGAGTGTAATGGCACAATCTCGGCTCACTGCAACCTCTGCCTCCTCGGTTCAA 

TGAGTAGCTGGGATTACAGGCGCCCACCACCACGCCTGGCTAATTTT^ 

TGGCCAGGCTGGTCTCAAACTCCTGACCTCAAGTGATCTGCCCGCCT^ 

GCCACCGTGCCCGGCATACCTTGATCTTTTAAAATGAAGTCTGAAAC^TTGCTACCCTTGTCCTGAGCAAT 
AGTGTATTTTAGCrCIXXJCCACCCCCCAGCCTGTGTGCTGTTTTCCCTGCTG 
CCCC(^CAAGCTAAGCATTATTAATATTGTTTTCCGTGTTGAGTC 
TTTGTTCCCCGTCTGTCTTCTGTCTCAGGCCCGCC 

TTATTGCTGGTAAACCCCAGCTTTACCTGTGCTGGCCTCCATGGCATCTAGCGACGTCCGGGGAC 
ACAGATGAAGATGTGGAGACTCACGAGGAGGGCGGTCATCTTC^^ 

CTTAGCCAGTGAGTGACAGCAACGTCCGCTCGGCCTGGGTTCAGCCTGGAAAACCCCAGGCATGTCGGGGTCT 

CCGCGGTGTCGAGTTTGAAATCGCGCAAACCTGCGGTGTGGCGCCAGCTCTGACGGTGCTGCCT 

CITCCTCCCTTCTGCTTGGGAACCAGGACAAAGG 

ATGTGGATAATTTTAAAATTTCTAGGCTGGGCGCGGTGGCTCACGCCTGTAATCCCAG 
TGGATCACGAGGTCAGGAGGTCGAGACCATCCTGGCCAACATGATGAAACC 

TGGGCGTGGTGGCGGGTGCCTGTAATCCCAGCTACTCGGGAGGCTGAGGCAGGAGAATTGCTTGAACCTGGGAGT 

GTTG CAGTGAGCCGACATTGCACCACTG CACTCCAGCCTGGCAACACAGCGAGACTCTGTCTCAAAAAAAAAAAAAAAAA 

AAAAAAAAAAAATTCTAGTAGCCACATTAAAAAAGTAAAAAAGAAAAGGTGAAATTAATGTAATAA^ 

GCCCAGCATGTCCACACCTCATCATTTTAGGGTGTTATTGGTGGGAGCATCACTCACAGGACAT^ 

TTTGTCTGCGGGATCCCGTGTGTAGGTCCCGTGCGTGGCCATCT 

GTTGTACCAGATGGTGCAGGTCCGGGATGAGGTCGCCAGGCCCT 

TCTGGGATGAGGTTOCCAGGCCCTGCTGTGAGCTGGATGTGTGGTGTC^ 
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GCCCTCGGTGAGCTGGAGGTATGGAGTCCGGATGATGCAGGTCCGGGGTGAGGTCGCCAGGCCCT 

TGTGGTGTCTGGATGGTGCAGGTCAGGGGTGAGGTCTCCAGGCCCTCGGTAAGCTGGAG 

GGTCCGGGGTGAGGTCGCCAGGCCCTGCTGTGAGCTGGATGTGTGGT^ 

AGGCCCTGCGGTGAGCTCGGTGTGCGGTGTCTGGATGGTG 

GGTGAGCTGGATATGCGGTGTCCGGATGGTGCAGGTCTGGGGTGAGG 

GTCCGGATGCTGCAGGTCCGGTGTGAGGTCACCAGGCCCTGCTGTGAGCTGGATC 

GGGGTGAAGGTCGCCAGGCCCCTGCTTGTGAGCTGGATGTGTGGTGTCTGGATGGTGCAGGT 

GCCCTCGGTGAGCTGGATGTGCAGTGTCCAGATGGTGCAGGTCCGGGGTG^ 

TGCGGTGTCTGGATGGTGCAGGTCTGGAGTGAGGTCGCCAGGCCCTCGGTGAGCTGGATGTA 

GGTCCGGGGTGAGGTCGCCAGACCCTGCTGTGAGCTGGATGTG&GTGTCTGGATOT 

AGACCCTCCTGTGAGCTGGATATGCGGTGTCCGGATGGTGCAGGTCAGGGGTGAGGTCT 

GGTATGGAGTCCGGATGATGCAGGTCCGGGGTGAGGTCGCCAGGCCCT 

GCAGGTCTGGGGTGTGGTCGCCAGGCCCTCGGTGAGCTGGAGGra 

CCAGGCCCTGCTGTGAGCTGGATGTGCGGCGTCTGGATGGTGCAGGTCTGGGGTGTGGTCGCCAGGCCCTCGGTGAGCTG 

GAGGTATGGAGTCCGGATGATGCAGGTCCGGGGTGAGGTTGCCAGGCCCTGCTGTGAGCTGGATGTGCTGTATCCGGATG 

GTGCAGTCCGGGGTGAGGTCGCCAGGCCCTCCTGTGAGCTGGATGTGCTGTATCCGGATGGTGCAGGTCT^ 

CACCAGGCCCTGCGGTGAGCTGGTTGTGCGGTGTCCGGTTGCTGCAGGTCCGGGGTGAGTTCGCCAGGCCCTCGGTGAGC 

TGGATGTGCGGTGTCCCCGTGTCCGGATGGTGCAGGTCCAGGGTGAGGTCGCTAGGC^ 

GTCCGGATGGTGC^GGTCTGGGGTGAGGTCGCCAGGCCTTTGGTGAGCTGGATGTC 

GGGTGAGGTCGCCAGGCCCTTGGTGGGCTGGATGTGTGGTGTCCGGATGGTG 

GCTGTGAGCTGGATGTGCGGTGTCTGGATGGTGCAGGTCCGGGGTGAGGTAGCCAAGGCCTTCGGTGAGCTGGATGTGGG 
GTGTCCGGATGGTGCAGGTCCGGGGTGAGGTCGCCAGGCCCTGCGGTTAG 

CCGGGGTGAGGTCACCAGGCCCTGCGGTTAGCTGGATGTGCGGTGTCTGGATGGTGCAGGTCCGGGGTGAGGTCGCCAGG 
CCCTGCTGTGAG CTGGATGTG CTGTATCCGG ATGGTGCAGGTCCGGGGTGAGGTCG CCAGGCCCTGCAGTGAGCTGG ATG 
TGCTGTATCCGGATGGTGCAGGTCTGGCGTGAGGTCGCCAGGCCCTGCGGTTAGCTGGATATGCGGTGTCGGATGGTGCA 
GGTCCGGGGTGAGGTCACCAGGCCCTGCGGTTAG CTGGATGTG CGGTGTCCGGATGGTGCAGGTCTGGGGTGAGGTCG CC 
AGGCCCTGCTGTCAGCTGGATGTGCTGTATCCGGATGGTGCAGGTCCGGGGTGAGGTCGCCAGGCCCTGCGGTGAGCT 
ATCTGCTGTATCCGGATGGTGCAGGTCTGGCGTGAGGTCGCCAGGCCCTGCGGTGAGCTGGATGTGCAGTC 
TGCAGGTCCGGGGTGAGGTCGCCAGGCCCTGCGGTGGGCTGTATC 
CGCCAGGCCCTGCGGTGAGCTGGATGTGTGGTGTCTGGATGCTGCAGGTC 

TGGATATGCGGTGTCCCCGTGTCCGAATGGTGCAGGTCCAGGGTGAGGTCGCCAGGCCCTTGGTGGGCTC 

GTCCGGATGGTGCAGGTCTGGGGTGAGGTCGCCAGGCCCTTGGTGAGCTGGATGTGCGGTGTCCGGATGGTGCAG 

GGGTGAGGTCACCAGGCCCTCGGTGATCTGGATGTGGCATGTCCrTCrCGTTTAAG 

Intron 3 (SEQ ID NO 6) 

GTACTGTATCCCCACGCC^GGCCTCTGCTTCTCGAAGTCCTGGAACACCAGCCCGGCCTCAGCATGCGCCTGTCTCCA 

TGCCTCTGCrTCCCTGGCTGTGCAGCTCTGGGCTGGGAGCCAGGGGCCCCGTCACAGGCCrrGG 

CAAGGCTCTGACTGCCTGGAGCTCACGTTCTCTTACTTGT 

AAGQVGAAGGGATTTAAATTAGATGGAAACACTACCACTAGCCTCCT 

TCTCTTTTTTTTTTCTTTTTTGAGATGGAGTCTCACTCTGTTGCCCAGGCTGG 
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GCAACCTCCACCTCCTGGGTTTAAGCGATTCACCAGCCrCAGCCT 
GCCTGGCTAATTTTTGTACTTTTAGGAGAGACGGGGTTTCACCATGT^ 
TGATCCACCG&CCTTGGCCTCCCAAAGTGCTC 
GATGCTGTTCTGTATGAATCTTCAATCTATTGGATT^ 
5 CAGGGAGCACCTGTGCAGGGAGCACCTGGGGATAGGAGAGTTCCACCATGAGCT 
GCTGTGAGATTTTGTCTGCAATGTTCGGCTGATGAGAGTGTGA 

GGACGGGAGCGCTGGTCTGGGAGATGCCAGCCTGGCTGAGCCCAGGCCATGGTATTAGCTTCTCCGTGTCCC^ 
TGACTGTGGAGGGCTTTAGTCAGAAGATCAGGGCTTCCCCAGCTCCCCTGCACACTCGAGTCCCT 
ACCCCATGCCCCAAATCAGGATGTCTGCAGAGGGAGCTGGCAGCAGACCT^ 
10 GACCCCGACGTGGTGCTGGGGCCATTTCCTTGCATCTGGGGGAGGGTCAGGGCTTTCCCTGTGGGAAG 
AATGCACCTTACTTAGACTTTACACGTATTTAATGGTGTGCGACC 
TTAATTGGGGTGACCGGAAGGAGCAGACAGACGTGGTGGTCCCCAAGATC 
CCTGGGGGGCCTTGGAGGCCCCTCCTCCCTGGACAGGGTACCGTGCCTTTT^ 

AGGGCACCAGCTCCGGAGCACCCGCGGCCCCAGTGTCCACGGAGTGC^GGCTGTCAGCCACAGATGCCCAGGTCCAGGT 
15 GTGGCCGCTCCAGCCCCCGTGCCCCCATGGGTGGTTTTGGGGGAAAAGGCCAAGGGCAGAGGTGTCAGGAGACTGGTGGG 
CTCATGAGAGCTGATTCTGCTCCTTGGCTGAGCTGCCCTGAGCAGCCTCTCCCGCCCTCTCCATCTGAAGGGATGTGGCT 
CTTTCTACCTGGGGGTCCTGCCTGGGGCCAGCCTTGGGCTACCCCAGTGGCTGTACCAGAGGGACAG^ 
AGGGGCATGGGTTCAOSTGGCCCCAGATGC^GCCTGTCACCAGGCT^ 

GTTGACCGCCGGACTGGGCGTCCCCAGGGTTGACTATAGGACCAGGTGTCCAGGTGCCCTGCAAGTAGAGGGGCTCTCAG 
20 AGGCGTCTGGCIXX3CATCGGTGGACGTGGCCCCGGGCATGGCCTTCAGCG 

TGAGTCGGTGGGGGCTTGTGGCTTCCCGTGAGCTTCCCCCTAGTCTGTTGTCTGGCTGAGCAAG 
CTATTGCAG 

Intron 4 (SEQ ID NO 7) 

25 GTGGCTGTGCTTTGGTTTAACTTCCTTTTTAAACAGAAGTGCGTTTGAGCCCCACATTTGGTATCAGCT^ 

CCCGGAGGAGGGGCCACGGGACACAGCCAGGGCCATGGCACGGCGCCAACCCATTTC 

TGCCGGTGCCTCCAGAAAAGCAGCGTGGGGGTGTAGGGGGAGCTCCTGGGGCAGGGACAGGCT^ 

CAGCCGGGCCAGGGCCTGGATGCAGCACGGCCCGAGGTCCTGGATCCGTGTCCTGCTGTGGTGCGCAGCCT 

TCCGCTTACGGGGCCCGGGGACCAGGCCACCACTGCCAGGAGCCCACCGGGCTCTC 
30 CTCCTGCACCCCACCCCTGTGGCTGCGGTGGCTGCGGTGACCCCGTCATCTGAGGAGAGTGTGGGGTGAGGTGGACAGAG 

GTGTGGCATGAGGATCCCGTGTGCAACACACATGCGGCCAGGAACCCGTTTCAAAC^ 

TTCTAGGTCCCGGGTCTGGGTGGCTGGGGACACTGGGGAGGGGCTC 

TTGGCCGGATCCACTTTCCTGACTGTCTCCCATGCTGTCCCCGCCAG 

35 Intron 5 (SEQ ID NO 8) 

GTGGGTGCCGGGGACCCCCX5TGAGC^GCCCTGCTGGACCTTGGGAGTGGCTC 

GAGGTACTCCTGGGTGGGCCGCAGGGAGTGCAGGTGACCCTGTCACTGTTGAGGACACACCTGGCACCTAGGGTGGAGGC 
CTTCAGCCTTTCCTGCAGCACATGGGGCCGACTGTGCACCCTGACTGCCCGGGCTCCTATTCCC 

GATTCCAGTTTCCGTCAGAGAAGGAACCGCAACGGCTCAGCCACCAGGCCCCGGTGCCTTGCACCCCAGTCCTGAGCCAG 
40 GGGTCTCCTGTCCTGAGGCTCAGAGAGGGGACACAGCCCGCCCTGCCCTTGGGGTCTGGAGTGGTGGGGGTCAGAGAGAG 
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AGTGGGGGACACCGCCAGGCCAGGCCCTCAGGGCAGAGGTGATGTCTGAGTT^ 
. CTCCACTCACACAG 

5 % -Bereich Intron 6 (SEQ ID NO 9) 

5 GTAAGGTTCACGTGTGATAGTCGTGTCCAGGATGTGTGTCTCTGGGATATGAATGTC 

ATGCGTTTCTGTGGTGGAGGTACTTCCATGATTTACACAT 
• GTATCTGTGGCGTGCATATTTGTGGTGTGTGTGTGTGTGGCACGTGTGTGTCCATC 

TGTGTGTGTCTGTGACACGTGCATGTTCATGCTGTGTGCTGCATC 

GTGTCCGTGACATATGCGTGTCTATGGCATGGGTGTGTGTGGCCCCTTGGCCTTACT 
1 0 GCACCATTGTCCTCACGCTCTCGGGTGCTGGTTTGGGGAGCTCCACATTCAGGGTCCT 

GTCCTGTCACAGGGCTGGGCCTTGGAGACTGTAAGCCAGGTTTGAGAGGAGAGTA 

CCCCIGGCACCCCCAGGACCCCAGtCTGGCCTATGCCGGCT 

"GGGACACACTCCTCCCAGAGCGGCCGGGGGCCITGGGGCTCGGCAGGGG 

AGTGGTCATGAGCACGCTGGAGGGGTAAGCCCTC^AAGTCGTGCCAGGCCGGGGT^ 
15 GCTTCGGTCTGGGGAGAGGCACATGTGGAAACCCACAAGGACCTCTTTCTCTGACTTCTTGAGCT 

3*-Bereich Intron 6 (SEQ ID NO 10) 

TGTGGGATTGGTTTTCATGTGTGGGATAGGTGGGGATCTGTGGGATTGGTTTTTATGAGTGGGGTAA 

* 

GCGAGCTTTCTTCCTGTAGTGGGTCTGCAGGTGCTCCAACAGCTT^ 
20 CGGGTTTATAGTAAGTCAGGGGTGTGGAGGCCTCCCCTGGGCTCCCTGTTCTGTTTCTTCCACTCTGGGGTCGTGTGGTG 

CCTGCTGTGGTGTGTGGCCGGTGGGCAGGGCTTCCAGGCCTCCTTGTGTTCATTGGCCTGGATGTGGCCCTGGCTACGCT 

CCGTCCTTGGAATTCCCCTGCGAGTTGGAGGCTTTCTTTCTTTCT 

GTCTCGCTCITTTTTGCCCAGGCTGGAGTGGTTTGGCGTGATCTTG 

ATTCTCTTGCCTCAGCCTCCCAAGTAGCTGGAATTATAGGCGCCCACCACCATG^^ 
25 AGACGAGGTTTCTCCATGTTGGCCAGGCTGGTCTCGAACTCCTGACCTCAGGTGATCCTCCCACCTCGGCCTCCCAAAGT 

GCTGGGATGACAGGTGTGAACCGCCGCGCCCGGCCGAGACTCGCTTCCTGCAGCTTCCGTGAGATCTGCAGCGATAGCTG 

CCTGCAGCCTTGGTGCTGACAACCTCCGTTTTCCTTCTC 

CAGAAGAGTTTCACGTGTGCTGATTTCCCGGCTGTTTCCTGCGTAATTGGTGTCTC 
TTTCCTTTAGGCTTTGTTTATTGTTGTTTTTCCGGCTCCTTGAAGGAAAAGTTTCGATTATGGA 
30 TCTAAACAAGCATCTGAAGTTGCCGTTTTCCCTCTAAAGCAGGGAT 

GGGGCCTGTTAGGAACCCGGCGCACAGCGGGAGGCTAGGTGGGGTGTGGOT 

TCTGAGATCAGCAGTGGCATGCGGTGCTCAGAGGCGCACACACCCTACTGAGAACTGTGCGTGAGAGGGG 
GTGCTCCTTATGGGAATCTAATGCCTGATGATCTGAGGTGGAACCGTTTGCTCCCAAAACCATCCCCTTCCCCACTGCTG 
TCCTGTGGAAAAATCGTCITCCACGAAACCAGTCCCTGGTACCACAATGGTTGGGGAC 
35 GCAGCCTCTCXSTCAGTGTTGATATATTGGCTTTTCT^ 

CGACCTCAGACCCATGGGCTATTTGTGGGCGTGTTGCCTGCTCCTGGGTTGGGAAGGGTC 

GTTACTGCCTTCCAGGTTGGTTCTCAGGGTTGAATCGTACTCGATGTGGTTTTAGCCCACGGCCCTGCCGCC^GCTCCTC 
GGGGCTGGGG AACATGCTGAAGCACAGAGTCACCGTGCGCGTCTTTTGA 
TGTTAGTGTGTGTCACGTGCCTGCTCACATCCTGTCTTGGGGACGCAGGGGCTTAGC^ 
40 GTCCTGGGGGAGTCTGCAGAATAGGAGGTGGGGGTGCCGGTCTCTCTCCCGCGTCTTCAGACTCTTCT 
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GTGGCTGCACCTGCATCCCTGCAATCCCTCCA^ 

GACTGTGGATGGCAGTCGGTC^CGGGGGTCTGATGTGTGGTGACT^ 

GTGACTGTGGATGGCGGTCX5TGGGGTCTGATGTGGTGACTC 

ATGGCGGTCGTGGGGTCTGATGTGGTGACTGTGGATGGCGGTCGTGGGGTC 

GGGTCTGATGTGGTGACTGTGGATGGCAGTCGTGGGGTCTGATGTGTGGTG 

TGGTGACTGTGGATGGCAGTCGTGGGGTCTGATGTGTGGTGACTGTGGATGGCGGT 

GTGGATGGCGGTCGTGGGGTCTGATGTGTGGTGACTGTGGATGGCGGTCGTGOT 

CGGTCGTGGGGTCTGATGTGGTGACTCTGGATGGCGGTCGTGGGGTCTGATO 

CAGGGGTCTGATGTGTGGTGACTGTGGATGGCGGTCGTGGGGTCTGATGTC 

GGGTCTC^TGTGTGGTGACTGTGGATGGCGGTCGTGGGGTCTC 

TCTGATGTGTGGTGACTGTGGATGGCGATCGGTCACAGGGGTCTGATGTGTGGTGACTGTGGATGGCGGTCGTGGGGTCT 

GATGTGTGGTGACTGTGGATGGCGGTCGTGGGGTCTGATGTGTGGTGACTGTGGATGGCGGTCGTGGGG 

GACTGTGGATGGCGGTCGTGGGGTCTGATGTGGTGACTGTGGATGGCGGTCGTGGGGTCTGATGTGTGGTGACTGTGGAT 

GGCGGTTGGTCCCGGGGGTCTGATGTGTGGTGACTGTGGATGGCGGTCGTGGGGTCTGATGTGGTGACTGTGGATGGCAG 

TCGTGGGGTCTGATGTGTGGTGACTGTGGATGGCGGTCGTGGGGTCTGATGTGTGGTGACTGTGGATGGCGGTCGTGGGG 

TCTGATGTGTGGTGACTGTGGATGGCGGTCGTGGGGTCTGATGTGTGGTGACTGTGGATGGCGGTCGTGGGGTCTGATGT 

GGTGACTGTGGATGGCGGTCGTGGGGTCTGATGTGTGGTGACTGTGGATGGTGATCGGTCACAGGGGTCTGATGTGTGGT 

GACTGTGGATGGCGGTCGTGGGGTCTGATGTGTGGTGACTGTGGATGGCGGTCX3TC 

GGCXjGTCGTGGGGTCTGATGTCTGGTGACTGTGGATGGCGGTCGTAGGGTCTGATGTGTGGTG 

GTCACAGGGGTCTGATGTGTGGTGACTGTGGATGGCGGTCGTGGGGTCTGA^ 

GGTCTGATGTGTGGTGACTGTGGATGGCGGTCGTGGGGTCTGATGTCTGGTGACTGTGGATGGCGGTCGTGGGGTCTGAT 
GTGGTGACTGTGGATGGTGATCGGTCACAGGGGTCTGATGTGTGGTAGCTGCAGGTGGAGTCCCAGGTGTGTCTGTAGCT 
ACTTTGCGTCCTCGGCCCCCCGGCCCCCGTTTCCGAAACAGAAGCTTCCCAGGCGCTCTCTGGGCTTCATCCCG 
GGCTTGGCCGCAGGTCCACACGTCCTGATCGGAAGAAACAAGTGCCCAGCTCTGG CCGGGGCAGG CCACATTTG TGGCTC 
ATGCCCTCTCCTCTGCCGGCAG 

Intron 7 (SEQ ID NO 11) 

GTCTGGGCACTGCCCTGCAGGGTTGGGCAQjGACTCCCAGCAGTG 

GACAGACTGTTGGCCCTGGGGGGCAGTGGGGGGAATGAGCTGTGATGGGGGCATGATGAGCT 

TGAGCTGGGCCATGCCAGGCTGCGACAGCTGCTGCATTCAGGCACCTGCTCACGTTT 

CCGCAGTGCCTTTGTTCATGATTTGCTAAATGTCTT 

CCTTTAGGAGGGCAGGCCATGTTTGAGCCGTGTCCTGCCCM 

TGTCCCCCTTCTTAGGAGGAOX^CCGTGTTTGAGCCACGCCC^ 

GGCCCTGTGGCCCTTTGCAGATGTGGTCTGTCCACGTGGCCCTGTGGCTCTTTGCAGATGCCTGTTAGCACTTGCT 

TCTAGGGGACAGTCGTGTCCACCGCATGAGGCrCAGAGACCrCTC 

GTGGCCTGGGCTGCTGGGACCC^GACCCTGTGCCCGGCAGCTGGGCAGCAACT 

CGGTGGGCTGTGTGGGTGTGAGCCCAGCTGGACCCACAGGTGGCCCAGAGGAGACGTTCTGTGTCACACACTCTGCCTAA 
GCCCATGTGTGTCTGCAGAGACTCGGCCCGGCCAGCCCACGATGGCCCTGCATTCCAGCCCAGCCCCGCACTTCATCACA 
AACACTGACCCCAAAAGGGACGGAGGGTCTTGGCCACGTGGTCCTGCCTGTCTCAGC^CCCA 
TCTCCCGTCTGCTTTCGCAG 
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Intron 8 (SEQ ID NO 12) 

GTGAGTCAGGTGGCCAGGTGCCATTGCCCT 

CTTCCCCACTCNCCITCTGCCCGGGGCCACCAGAGTCT^ 

TCCCGAGGCCCCXX3AAACATGGCTCGGCTTGCGGCAGCCGGAGCGGA 

GGGGTGTGGAGTTGCTCCTGCGTGGAGGACGAGGGGCGGGGGGTC 

GCAGCTTGTCAGCTCCAAGTTACTACTGACGCTGGACACCCGGCTCTCAC^ 

GGATT1TATCCGATTCTCATTCCTGTCCCTGTCGTGTGACCCCCGCGAGGGCGCGGGCT 

CCCATCTGGAAAGTGCGGGGTTGACCGTGTAGTTTGCTC 

GAGAGCTGCCGTCACACAGCC^TGGGTGAGCCACACTCAC^ 

CTGGATTTTAAGTAAAACCACACACCTCCCGGCAGGCATCTGCCTGCGACCCTGTGTC 
GGAGG AAATTCGTGCACACTCAAGGTCATCAGCAAGGTCATCCGCAGTCAGGT 
GTCTCCAGCGGATAAAGGACTGTGCACAGCTTCGGAAGCTTTTATTTAAAAATATAACTATTAATTA 
AATCACTAATGGTATCAGCAATTATAATATTTATT 

CACAAATTGCACATGGCAGCAGAGTGAATTTTGGCCGAGGGACACGTGTGCACATGTGTGTAAGCGGCCCCCAGGCCCAC 

AGAATTCGCTGACAAAGTCACCTCCCCAGAGAAGCCACCACGGGCCTCCTTCGTGGTCGTGAATTTTATTAAGATGGA 

AAGTCACGTACCGTCCACGTGTGGCAGGGCTTTGGGGAATGTGAGGTGATGACTGCGTCCT 

GGTGACTGTGTCTGTCCTGTCCCTAGGACACGGACAGGCCCGAAGCTCT^ 

ATAAAAACGTCTTCAAAACCTGTTGCCCCAAAAACTAAGAAGAGAGAGAGTTT^ 

TCTGCTTGCGTTGACTCGCTGGGCTGGCCGGACTCCTAGAGTTGGTC 

GCCCATCACTGTGATATCTGCACCAGCAAGGAAAGCCrrCTTTTCTTTTCTT 

CTGTTGTCTGCCTGGGCTTGAGTGCAGTGGCXjCGATCTCAACTCACTC 

CTGCCTCAGCCTCCCGAGC^GCTGAGATTACAGGCACCCACCCCCTGCGCCTGGCTAATTTTTGTATTTTTA 
GGGTTTTTGCCATGTTGGCCAGGCTGGTCTCGAACTCCTGACCT 

GGATTACAGGTGTGAGCCATCACGCCCAGCCGGAAAGCCTCITTTTAAGGTGACCACCTATAGCGCTTCCTO 
AGGTCTTGTTTTTGCAGTAGGCTGCAAGCGTCTCTTAGCA^ 

TCGCX3TGGCAGCCATGCCTTCTGTGTGCACCTTTAGGTTCCACGGGGCTATTCTGCT 
CCCTTGGCATCCTTGTTTGGAGAGTTTCTGCTTCTCGTTGGTCATGCrG 

GCAGCGGCTACATGTAGGGTCATGAGTCTTTCACCGTGGACAAATTCCTTGAAAAAAAAAAAAGGA^ 

TCATTCCGGGTCAAGTGTCTGGTTCTGTGAATAAACTCTAAGATTTAAGAAACCTT 

AGAGCAAGGATGTGGTC^CACCTGTGGCTGGATCTGTTTCAGC 

TTTGTTCAGAGGTCTCATCTGGTATGTTTCTGAGGTGTTTGCCGGCTGAATGGTAGA 

TCTGTGTCTGTGTGTGGCTCGGTTTGAGTGTACGCATGTCCAGCACATGCCCTGCCCGTCT 

CCCAG 

Intron 9 (SEQ ID NO 13) 

GTGAGGCCTCCTCTTCCCCAGGGGGGCTTGGGTGGGGGTTGATTTGCTTTTGATGCA 
TCTGGAGACCATGACTGCTCTGTCTTGAGGAACCAGACAAGGTTGCAGCCCCTTCTTC 
TTGCACAGCCTGAGGACTGCGGGCTCCACGCAGGCTCTGTCCAGCGGCCATGTCCAGAGGCCTCA 
GAGGGCCGCTGCCCTGCATGATGAGCATGTGAATTCAACACCGAGGAAGCACACCAGCTTCTGT 
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OTTTAGGGTCCTTGGGGAGATGGGGCTGGTGCAGCCTGAGGCCCCACATCT 
CTGGGCGCCTCTTCAGCCCATTGCCCATCCCACTTGCATGGGG 
AACCTAATGTGGTTCAACTCAGCTGGC"X w riTATTGACAGCAGTT 
ATGTGCACGACGTGCAGGTTAGTTACATATGTATACATGTGCCATC 
5 TTAGGTATATCTCCTAATGCTATCCCTCCCCACrCCCCCCATCCCATGACAGGCCCTC 
TGTCCAAGTGTTCTCATTGTTCAGTTCCCACCTGTGAGTGAGAACA 
GCTCAGAGTGATGGTTTCCAGCTTCGTCCATGTCCCTACAAAGGACA 
CCGTGGTGTATATGTGCC^CATTTTCITAATCCAGTCrATCA 

GTGAATAGTG CCGCAATAAACATACGTGTGCATGTGTCTTTATAG CAGCATGATTTATAATCCTTTGGGTATATACCCAG 
10 (1 . TAATGGGATGGCKKK3TCAAATGGTATTTCTAGTTCTAGATCCTTGAGG 

CTAGTTTACACTCCCACCAACAGTGTAAAAGTGTTCTGGTGCTGGAGAGGATGTGGACAG 

TAGTATCACTGAACAAGCAGAGAGTTAGTGAAGGATGCGTCAGGAAGCCTC 

TCCX3GGTTTTTCCTGTGCATCTTTTGAAACTCTAGCTCCAATTATAGCATGTACAGTG 

GGTTCAAGTTCTAGATTGAAATAAGTTTATGTAACAGAAACAAAAATTTCTTGTAC^ 
15 GGAAAGTGTCCTCGAGCTGGCGGCACACTGGTCAGCCCTCTGGGACAGGATACCTCTGGCCCATGGTCATGGGGCGCTGG 

GCTTGGGCCTGAGGGTCACACAGTGCACCATGCCCAGCTTCCTGTGGATAGGATCTGGGTCTCGGATCATGCT 

ACAGCTGCCATGCTGGTAAAGGGCACCACGTGGCTCAGAGGGGGCGAGGTTCCCAGCCCCAGCTTTCT 

TTATTTTTCCCTAAGAGTCTGAGAAGTGGGGCCGCGCCTGATGGCCTTCGTTCGT 

G CTGATGGT AAACACTG AGTACTTATAATGAATG AGG AATTGCTGTAG CAGTTAACTGTAGAG AGCTCGTCTGTTGGAAA 
20 GW\ATTTAAGTTTTTCATTTAACCGCTTTGGAGAATGTTACTTTA 

TCGTAGACAGATACTACGTAAAAAGTGTAAAGTTAACCTTGCTGTGTATTTTCCCTTATTTTAG 

Intron 10 (SEQ ID NO 14) 

GTGAGGCCCGTGCCGTGTGTCTGTGGGGACCTCCACAGCCTGTGGGCTTTGCAGTTGAGCCCCCCGTGTCCTGCCCCTGG 
25 CACCGCAGCGTTGTCTCTGCCAAGTCCTCTCTCTCTGCCGGTGCTGGATCCGCAAGAGCAGAGGCGCTTGGCCGTGCACC 

CAGGCCTGGGGGCGCAGGGGCACCTTCGGGAGGGAGTGGGTACCGTGCAGGCCCTGGTCCTGCAGAGACGCACCCAGG 

ACAGACGTGGTGAGTGCAGGCGGTGACCTGGCTCCTGCTGCTCTTTGGA^ 

TGAGACCCCCAGGAGCTGTGCACAGGGCCTGCAGGGCCGAGGCGGCAGCCTCCT 

GAGCAGGAGCTGCTGAGTGAGCTGGCCCACAGCGTTCGCTGCGGTCACGTTCCTGCGTGGGG 
3 0 AGAATTTGGATTTCCTGAGTGCTGCTGTCTTGAACCACGGAGATGGCTAGG 

CAAACTAAAATCAGGCACAGGGGACCTGGCCTCAGCACAGGGGATTGTCCAATGTGGTC 

AGCCGGTGGGCTTGTTTTAAAGTGCGATTTGACGAGGGACGAGAAAGCTTC 

TGGCCGCCAGGGGTGGTTTC^GGTGCTTTGCTGGGCTGTGTTTG 

TCCAGGTCCACCCTCCAGGGCCX3CCCTGGGCTGGGGGTATGCCTGGCGTTCCTTGTGCCGCAGCCCGG 
35 TGTGCACATTTAAATCCACTAAGATTCACTCGGGGGGAGCCCAGGTCCCAAGCAACTGAGGGCTCAGGAGTCCTGAGGCT 
GCTGAGGGGACAGAGCAGACGGGGAACGCTGCTTCTGTGTGGCAAGTTCCTGAG 

GTGTATGTTGGGGTCCCACCGGGGGCAGAACTCTGTCTCTGATGAGTCGGCAGCCATGTAACAGGAAGGGGTGGCCACAG 
GGAGCTGGGAATCCACCAGGGGAGCTGCGCAGCTGGCCGAGGTCCCAGGGCCAGGCCA^ 
GGGGCCACAGCAGAGGCCGCAGGAAGGGAAGGGGATGCCCAGGCCAGAGCAGAGGCrACCGGGCAC^ 
40 AGCTGGGTGAGCGAGGCTCATGACTCGGCGAGGGAACCTCCTTGACXSTGAAGCTGACGACTGGTC 
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CCCAGCCAGGTCCCGCGCCTGAGCAGGAA 

AGGAGAAAACAGGCAAAGTCGTTGAGAAACGTCTTAAAAGAAGGTGGGATGG 

GCCCCGGACCACAGATGAGTCTATAACGGGATTGTGGTGTTGCCATGGGG 

TGGGGCTGCACCTCCCATCTGAGTCCTGGCTGTCCCGGGTCCATC 
5 GGGAGACAGGGAAAGCACCCCX3AAGTCTGGAGCAGGGCTGGGTCCAGGCT 

GCTCCAAATCACCACTTCTCTGGGGTTTTCCAAAGCATTTAACAAGOT 
" TCCTGGGGCTGACATTGCCCCTCTGCCTTAG 

Intron 11 (SEQ ID NO 15) 

1 0 GTGAGCGCACCTGGCCGGAAGTGGAGCCTGTGCCCGGCTGGGGCAGGTC 

TCCX3TGTGGGGCAGGCGACTGCCAATCCCAAAGGGTCAGAGGCCACAGGGTGCCCCTCG^ 
AATGC^TCTTTCTGTGGGAGTGAGGGTGCTCACAACGGGAGCAGTTTTCTC 

CAGACCTGGGTGCACTGAGGTGTCTTCAGAAAGCAGTCTGGATCCGAACCCAAGACGCCCGGGCCCTGCTGGGCG 
CTCTCAAACCCGAACACAGGGGCCCTGCTGGGCATGAGTCCCTCTGAA 
15 CTCTCCGAACCCAGAGACTTCAGGGCCCTTTTGGGCGTGAGTCTCT 

AGTCTACAGGATGCCATGAGTTCATGATCACGTGTGACCCATCAGGGGACAGGGCCATGGTGTGGGGGGGGTCTCTAC^ 
AATTCTGGGGTCTTGTTTCCCCAGAGCCCGAGAGCT 

CACAGATGCAGAAATCTGTGCTGTTTCTTTTATGAATAAAAAGTATCAACATTCCAGGCAGG 
ATAATCCCAGCACTTTGGGAGGCCGAGGTGGGTGGATCACTTGAGGCCAGGAG 
20 AAATTCCATTTCTACTTAAAAAATACAAAAATTAGCCTGGCCTGGTGGCACA 

TGAGGCAGGAGAATCATTTGAACCCAGGAGGCAGAGGTTGCAGTGAGCCGAGATCACACCACTGCACTCCAGCCTGGGCA 
ACAGAGTGAGACTTCATCTTAAAAAAAAAAAAAAAAGTATCAGCATTCCAAAA 

TGTCCTTCGATAATATTTACTGGTGCTGTGCTAGAGGCCGGAACTGGGGGTGCCnTCCTCTGAAAGGCACACCTTCATGG 

GAAGAGAAATAAGTGGTGAATGGTTGTTAAACCAGAGGTTTAAACTGGGGTCCTGTCGTTCTGAGTTAACAGTCCAGATC 
25 TGGACTTTGCCTCTTTCCAGAATGCTCCCTGGGGTTTG 

GAGCAGCAGGTGCAGAOSCCCTCATGATGGGGGAGTGGCAGGTGCAGACACCCTTGTC 

TTGCAGCTCCCTCCCGACAAGGATGCCGGTCTCCTGTGCTCCCCACAGTCCCrc 

CTGGCCTCCACTGGCTTTGTCTGCATGATTTCCACATT^ 

GCAGTGCTGGCCATACCAGTCAGCTGTGAACTGTCCACTGCTTATTTTGCT 
30 ACCCCTGGTTCCAGCCTCTGGCACAGCATCAGTGAATGTTATTGAAGGACAAAGGACAGACAAACAA^ 

GTTCTCTCTAAACACATTGCAAAGCCACAGAGGCTAGTGCAGGATGGGTGGGC^ 

CCAGAATATTCTGTGCTCCCAAAGGCCAClTGGTCAGAGTGTGTGCTTGCAGAGGTGGCT 

GCAGTGGTTCGCCATACTCAGGGTGAACTCACATCCTCTC 

GAAGAAAACAGGCAAAATGATTAAGAAAAGTGAAAAAGGAAAAGTGGTAAGATGGGAATTTTCT^ 
35 TCCCAAACCACAGCTCAGATGGTAGAATGTGGTCAGAACTGATGGACAGAACAATAGAACAAAACGG 

CAGAAACGTGTGTTAATGTGGTATGTGGCACAGCTGATGGAAAAGAGAGTGTGTGTGTAAT^ 

GACTGGAAGCAAATAAGTTGTGTCTTTACAGC^TATACCAGAGCAGATTCTA 

ACCAGCAACAGAAATAAAACAAAAGACTCAAAGGGAAGGGAGGTGAACGTTC 

AGGGAGGCGGATGAAACCAGTGAGGCAACGGGCATTGCTTTCACTGCAGAGAAACT^ 
40 ATGGCCATTCCCTGGAGCGTTTGTGCACGTGATTTAriTAAGGCGCCCTGTGAGG 
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GTTCTCCTAACCACCTGAGAGGTAGAGGAGGAAAGGCTC 
ATGCATGATTGCAGCCTGGCCTCCTGCTCCX3GGGCCCTTGCT 

AGGGTGAGCCGGAGCCCAAGGTCGTGTTGGGGATGK3CTGTGAAAGAAGAAATGGACCT 

CTACCAGCAGCGTCAAAGAAATGCATGTGAAACTCACAGCGAGACCCATCCCTCAAAG 
5. GAGACCTGTCCCCATCCCTCATGCTGGCTCCTTTTCTGGGCT 

ACTTTTCTGGAAAGCAGCTTGTTTGCATGGAAGTCCTCACAATG 

CCAGACATTATCACGGGTCTTATTTACCATTTCCAGTGTTCCAOT 

CAAATACAGGGCTAAGGAGATATTATGCATCACAAAACTTGCTC^ 

GTTTAATGGCACAAAACGTTTATTTCAATGTAGCAGTGTTCAAAGCTGGATC 
1 0. TGAATGTCATGTGTGTTCATCTTTGGACATGGAGATACATGGGCAGTGAGTGGTGGTGAGGCCCT 

GATGCCTCCATCCTGCCCCTCTGGAGACACCATGTGTGCCACGTGCACT 

GCTCTTCCATCCCTGAGATTGAAACACAGTGAGATTCCCCACGCCCAACTCAGTC 

ACCTGTGTTCACTCGAGGGACGCCCGGGAGCCAGGGCTCCACAGTTTATTATGT 

TCATCAGGGCAGATGATGAGTGCACAAACACGGCCGTGCGAGGTTTGGATACACTCAACATCACTA 
15 GAGTTTGGTCATGCAGAGTCTGGATGGCATGTAGCATTTGGAGTCCATC^ 

GCATGCCCCAGGCAGGACAAGGAAGCGGGAGGAAGGCAGGAGGCTCTTTGGAGCAAGCTTTC 
, . GGGGCAGGCACCTGTGTCTGACATTCCCCCCTGTGTCTCAG 

Intron 12 (SEQ ID NO 16) 

20 GTGAGCAGGCTGATGGTCAGCACAGAGTTCAGAGTTCAGGAGGTGTGTGCGCAAGTATGTGTGTGTGTGTGTGCGCGCGT 
"GCCTGCAAGGCTGATGGTGACTGGCTG CACGTAAGAGTG CACATGTACGCATATACACGTGAGCACATACATGTGTGCAT 
' GTGTGTACATGAAGGCATGGCAGTGTGTGCACAGGTGTGCAAGGGCACAAGTGTGTGCACATGCG 

TGCATGTGTGTTCGTGCACAGTCGTGTGGGCATTCACGTGAGGTGCATGCGTGTGGGTGTGCAGTGTGAGTAGCATGTGT 
GCACATAACATGTATTGAGGGGTCCTCGTGTTCACCCCGCTAGGTCCTCAGCACCAGTGCCACTCCTTACAGGATGAGAC 

25 GGGGTCCCAGGCCTTGGTGGGCTGAGGCTCTGAAGCTGCAGCCCTGAGGGCATTGTCCCATCTGGGCATCCGCGTCCACT 
CCCTCTCCTGTGGGCTTCTGTGTCCACTCCCCCTCTCCTGTGGGCATTTACATCCACTCCACTCCCTCTCrrCCTC 
ATCCGCGTCCACTCCCCCTCTCTGTGGGCATCTGCGTCCACCTCCCCTCTCTGTGGGCA.TTTG 
GGTTCCTTCCTGTCTTGGCCGAGCCTCGGGGGCAGGCAGATGACACAGAG 
CCGGGTGAGGGCCAGGCCGGATTTCACTGGGAAGAGGGATAGTTTCTTGTCAAAATGTTCCT 

30 ■ ATGGATGATAAAGCAAAAAGTAAAAACTTAAAATCCCAGAGAGGTTTCT 

Intron 13 (SEQ ID NO 17) 

GTGAGCCGCCACCAAGGGGTGCAGGCCCAGCCTCCAGGGACCCTCCGCGCTCTGCTCACCTCTGACCCGGGGCT^ 
TGGAACTCCTGGGTTTTAGGGGCAAGGAATGTCTTACGTTTTCAGTGGTGCTGCT 

35 GCTCTGTGCAAAGCACCTOTTCrrCCATCTCTGGGTAGTGGTAGGAGCCGGTGTGGCCCCAGGTGT 

GCACTGGCCGTGGGACGTCATGGAGGCCATCCCAGGGCAGCAGGGGCATGGGGTAAAGAGATGTTTATGGGGAG 
CAGAGGAGGCTGGGAAGGTGTCTGAACAGTAGATGGGAGATCAGATGCCCGGAGGATTTGG 
GAGGTGGGTGCAGGTGAGGGTCGCTGGCCCCACCCCCGGGAAGGTGCAGCAGAGCTGTGGCT 
GCACCTGTGCTCTGGGCATGGCTGTGCTCCTGGAACGTTCCCTG 

40 ACAACTTTATCACAGAGGGAAGGGCCAATCTGTGG AGG CCACAGGG CCAGCTTCTGCCTGGAGTCAGGG CAGGTGGTGGC 
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ACAAGCCTCXKSGGCTGTACCAAAGGGCAGTCGGGCACCACAGGCCCGGGCCTCC^C 
GGAGCTGAATGCCAGGAGGCCGAAGCCCTCGCCCCATGAGGGCTGAGAAGG 
AGGCrGOSCGAATTACCGTGCAC^CTTGATGTGAAATG 
GAGTTTTCCATTACAAGGTCGTACCATGAAAAlXK3TTTTrAACCCGAGTGC 
5 AGAGCCACAGCTGCATGTTACCXSCCTTTGCACGAGCTCCAGAGGCT^ 
GGCTCAGACCGCCCTCCTCTCTGCCTTCTCTCTCTGCCTCAAAT 
CCCTCGTGCAAGCTGCTTGACTCCTTTCCGGAAACCCTTGGGGTGTGC 
CTGAGACTGTGGTTGACCCCAGGGTCCAGCTGGCGTGCTTGGGGCCTCCT 
CAGGTGAAAACTCCTGGGAAACTCCCAGGGCCATGTGACCTGCCACCTGCTCCT 
1 0 ATTTCCCCACCAGGGTCTCTAGCTCCGAGGAGCTCCCGTAGAGGGC 

CCATGTGGGGACCCTTGGGTAGTCGCTTGATTGGGTAGCCCTGAGGA^ 

AACACAGAGTCAGGC^CGTGGAAGGCCCAGGAATCCCCTTCCCTCGAGGCAGGAGTGGGAGAACGG 
ATTTCACGGCAGCCAGGCTGCAGTGGGCGAGGCTGTGGTGGTCCACGTGGCGCTGGGGGCGGGGTCTGATTCAAA 
TGGGGCTCGGCCTTCCTGGCCCGTGCTGGCCGCGCCTCCACACGGGCTTGGGGTGGACGCCCCGACCT 
15 TATTTCTCCCTTTGGAAGAGAGCCCCTCACCCATGCTAGGTGTTTCCCTrc 
CCGGGACCTTAGGCTTATTTATTTGTTTAAAA^ 

CACCTCAGCAGAGTTACTGAGAGGCTGAAACCGGGGTGCTGGCTTGACTGGTGTGATCTCAGGTCATTCCAGAAGTGGCT 
CAGGAAGTCAGTGAGACCAGGTACATGGGGGGCTCAGGCAGTGGGTGAGATGAGGTACACGGGGGGCTCAGGCAGTGGGT 
GAGGCCAGGTACATGGGGGGCTCAGGCACTGGGTGAGATGAGGTACACGGGGGGCTCAGGCAGAGGGTCAGACCAGGTAC 
20 ACGGGGGCTCTGATCACACGCACATATGAGCACATGTGCACATGTGCTGTTTCATC 
CCCAAAGTCCCAGGAAGCTGAGAGGCCAAAGATGGAGGCTGACAGGGCTGGCGCG 

CTTTGGGAGGCCGAGGCGAGAGGATCCCTTGAGCCCAGGAGTTTAAGACCAGCCTGAGCAACATAGTAGAACCCCATCTC 
TATGAAAAATAAAAACAAAAATTAGCTGAACATGGTGGTGTGCGCCTGTAGTTCCAATACTTGGGAGGCTGAAGTGGGAG 
GATCACTTGAGCCCAGGAGGTGGAAGCTGCAGTGAGCTGAGATTGCACCACTGTACTGCAGCCTGGGTGACAGAGTGAGA 
25 GCCCATCTCAACAACAACAAAGAAGACTGACAAATGCAGTTTC 

CAGAAGCCAAGTCGGTGTCTCGGTGTCAGTGAGATGAGATGATGGGTCCTCACACCATCACCCCAGACCCAGGGTTTATG 
CACCACAGGGGCGGGTGGCTCAGAAGGGATGCGCAGGACGTTGATATACGATGACATCAAGGTTC 

GATTCATGATAAGTACCTGCTGGTACACMGGAACAATGGATAAACTGGAAACCTTAGAGGCCTTCCCGGAACAGGGGCT 
AATCAGAAGCCAGCATGGGGGGCTGGCATCCAGGATGGAGCTGCTTCAGCCTCCACATGCGTGTTCATACAGATGGTGCA 
3 0 CAGAAACGCAGTGTACCTGTGCACACACAGACACGCAGCTACTCGCACACACAAGCACACACACAGACATG 

ATCCGTGTGTGTGCACCTGTGCCCATGAGGAAACCCATGCATGTGCATTCATGCACGCACACAGGCACCGGTGGGCCCAT 
GCCCACACCCACGAGCACCGTCTGATTAGGAGGCCTTTCCTCTGACGCTGTCCGCCATCCTCTCAG 

Intron 14 (SEQ ID NO 18) 

35 GTATGTGCAGGTG CCTGG CCTCAGTGG C^GCAGTGCCTGCCTGCTGGTGTTAGTGTGTCAGGAG ACTGAGTGAATCTGGG 

CTTAGGAAGTTCTTACCCCTTTTCGCATCAGGAAGTGGTTTAACCCAACCACTGTCAGGCTCGTC 
GGGGTGAGCAGAGCACCTGATGGAAGGGACAGGAGCTGTCTGGGAGCTGCCATCCTTCCCACCTTGCTCTC 
GCGCTGGGGGGCCTGGTCTCTCCTGTTTGCCCCATGGTGGGA 

GATTGGGCTGTCTCCCGTCCATGGCACTTAGGGCCCTTGTGCAAACCCAGGCCAAGGGCTTAGGAGGA 
40 GCTACCCCACCCCTCTCAGGAGCAGAGGCCGCGTATCACCACGACAGAGCCCCGCGCCGTCCTCTGCTTCCCAGTCACCG 
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TCCTCTGCCCCTGGACACTTTGTCCAGCATCAGGOAGGTTTCTGATCCGTCT 
CCTGAGCTTAACAGCTTCTACTTTCTGTTCTTTCT 
TCGTGACTCCTGCGGTGCTTGGGTCGGGA^^ 
GTGTCTCCTGGGAGGGGAGCTGGGCTGGGCCTGTGACTCCTCAGCCT 

Intron 15 (WEQ ID NO 19) 

GCAAGTGTGGGTGGAGGCCAGTGCGGGCCCCACCTGCCCAGGGGTCATCCrTGAACGCCCrrGTGTG 

AGATGCTGCTGAAGTGCAGACGCCCCCGGGCCTGACCCTGGGGGCCTGGAGCCACGCTGGCAGC 

CTGGTGTCCCCAGGCCACGGAGCCTGGCAGGGTCCCCAACTT^ 

CCACGCTTGGGAGCCTTCTGACCCCTGACCTGTGTCCTCTCACAGCCTCTTCCCTGG 

CCTGAGCAAGTTCTCTCCCCGCCCCGCCGCTCCAGCGTCACTGGGCTGCCTGTCTGCTCGCCCCGGTGGA 

TCCCTTCACTGAGGTTCCCACGAGCCAGGGCCACGAGGTGCAGGCCCTGCCT^ 

TTGGAGGATGCCACCTCTGGCCTCTTCTGGAACGGAGTCTGATTTTGGCCCCGCAG 

3 * -untranskribierter Bereich (SEQ ID NO 2 0) 

ATCTCATGTTTGAATCCTAATGTGCACTGCATAGACACCACTGT 

GGTCAGTGCX3GGCCCATGGCCTGGCTGTGCATTTACGGAAGTCTATGAGTGAATGGGGTTGTGG 

GCCTGGCTGGGCCTGGGAGGTTTCTGATGCTGTGAGGCAGGAGGGGAAGGAGGGTAGGGGATAGACAGTGGGAGCCCC^ 
CCCTGGAAGAC^TAACAGTAAGTCCAGGCCCGAAGGGCAGCAGGGATGCTGGGGGCCCAGCTTGGGCGGCGGGGATGATG 
GAGGGCCTGGCCAGGGTGGCAGGGATGATGGGGGCCCCAGCTGGGGTGG»GGGGTGATG 

GGGGG AAGATGGGGAAGCCTGGCTGGGCCCCCTCCTCCCCTGCCTCCCACCTGCAGCCGTGGATCCGGATGTGCTTCCCT 

GGTGCACATCCTCTGGGCCATCAGCTTTCATGGAGGTGGGGGGCAGGGGCATGACACC^TCCTGTATAAAATCC 

CCTCCTCCTGAACGCCCCAACTCAGGTTGAAAGTCACATTCCGCCTCTGGCCATTCTCTTAAGAGTAGACCAGGATTCTG - 

ATCTCTGAAGGGTGGGTAGGGTGGGGCAGTGGAGGGTGTGGACACAGGAGGCTTC^ 

ATCCTCTTATCATCTCCCAGTCTCATCTCTCATCCTCTTATCATCTC 

CTCATCTGTCATCCTCTTACCATCTCCCAGTCTCATCTCTTATCCTCTTATCTCCTAGT 

GGGCGGGTGCCAGGCTCGCAGTGGAGCTGGACATACGTCCTTCCTCAGGCAGAAGGAACTGGAAGGATTGCAGA^ 

GAGGGGCGGCTCAGAGGGACGCAGTCITGGGGTGAAGAAACAGCCCCrCCTCAGAAG 

AGGGCCCTGCGTGAGTGGCTCCAGAGCCTTCCAGCAGGTCCCTGGT^ 

CACCTTGGACAGGGCTTCTGGTTTGAGTGCAGCCCGGACGTGCCTGGTGTCGGGGTGGGGGC 

GCGTCATTTATTGCTGCTGCTTCAGAGAATGTCTGAGTGACCGAGCCTAATGTGTATGGTGGGCCCAAGTCCACA 

TGTCGTAAATGCACTCTGGTGCCTGGAGCCCCCGTATAGGAGCTGTGAGGAAGGAGGGGCTCTTGGCAGCCGGCCTGGGG 

GCGCCTITTGCCCTGCAAACrcGAAGGGAGCGGCCCCGGGCGCCGTGGGCGGACGAC 

AGGGCGGGGACTTCCCAGGAGCAGAGGCCGCTGCTCAGGCACACCTGGGTTTGAATCACAGACCAA 

GTTCAGCTATCCATCTTCTACAAAGCTCCAGATTCCTGTTTCTCCGGGTC 

TATATTTTTTGCTAAAGTATTAGACCCTTAAAAAAGGTATTTO 

TTGTCTGTTTTTATTTATTATTATTATTATTATTAGAGATGGTGTCTACTCTGTCA 

AGTCATGGCTCGCTGTAGCCGCAAACCCCCAGGCTCAAGTGATCCTC 

GTGTGAGCCACTGCCCTTGCCTGGCACTTTTAAAAACCACTATGTAAGGTCAGGTCCAGTGGCTTCCACACCTGTCATCC 
CAGTAGTTTGGGAAGCCGAGGCAGAAGGATTGTCTGAGGCCAGGAGTTTGAGACCAGCATGGGTAACATAGGGAGACCCC 
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ATCTCTACAAAAAATGCAAAAAGTTATCCGG^ 

AGG ATCG CTTGAG CCCGGGAGGTCATGG CTG CAGTGAGCTGTGATTGTACCAT CGCACTCCAGCCTGGG CAACAG AGTG A 
GACCCTGTCTCAAAAAAAAAAAAAAAAAAAGAAGGAGAAGGAGAAGAGAAGAAGAAGGAAG 
GAAGAAGGAAGAAAGAAGGAGAAGGAGGCCTGCTAGGTGCTAGGTAGACTGTCAAATCT 
5 AAGTTTTAAAGGGAAAGAAAAACCCCAGCTCTTTGGACTTCCTTAGGCC 

G ACAAG CGTGTATGGAG CGAGTG AGTTCAAAG CAG AAAGGGAGGAG AAGCAGG CAAGGGTGGAGG CTGTGGGTG ACACCA 
GCCAGGACCCCTGAAAGGGAGTGGTTGTTTTCCTGCCT 

GATGTTGGTGCCAGGTGCCCACCTGGGAAGGATGCTGTGCAGGGGGCTTGCCAAACTl^ 

GCACTTGTGGCAGGCACAATTACAGCCCCTCCCCAAAGATC^ 
1 0 CAAGGCAGAGGCTGGTGAAGGCTGCAGGTGGAATCACGGCTC 

TGGGCCTGATATGGCCACAAGGGTCCCTAGAAGTGAGAGAGGGAGGCAGGGGAGAGTCAGAGAGGGGACGTC 

CACTGGCCACTGCTGGCTTTGAGATGGAGGAGGGGGTCCCC^ 
■ AAGCAATCCTCCCCGGTCCTGAGGGCACACGGCCCTCCCCACGCCTCGATTTCAGGCCAGTC / 

CGGCCTCGAGAGCTGTAAGATGATGCX3TTTGTGTTCAGCCACTAAGCT 
15 CAGTACAGGGAAATGAATACAGGGACAGTTCTCAGAGTGACTCTCAGCCCACCCCTGGG 
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Die Charakterisierung der Exons zeigte interessanterweise, daB die in unserer 
Patentanmeldung PCT/EP/98/03469 beschriebenen, funktionell wichtigen hTO 
Protein-Domanen auf separaten Exons angeordnet sind. Das Telomerase- 
charakteristische T-Motiv befindet sich auf Exon 3. Die fur die katalytische Funktion 
der Telomerase wichtigen RT (Reverse-Transkriptase)-Motive 1-7 liegen auf 
folgenden Exons: RT Motiv 1 und 2 auf Exon 4, RT Motiv 4 auf Exon 9, RT Motiv 5 
. auf Exon 10, RT Motiv 6 und 7 auf Exon 11. RT Motiv 3 liegt verteilt auf Exon 5 
und 6 vor (s. Fig. 8). 

Die Aufklarung der Exon-Intron-Struktur des hTC-Gens zeigt auch,- daS die in 
unserer Patentanmeldung PCT/EP/98/03469 beschriebenen vier Deletions- bzw. 
Insertions-Varianten der hTC-cDNA ebenso wie drei weitere, in der Literatur (Kilian 
et al., 1997) beschriebene hTC-Insertions-Varianten hochstwahrscheinlich alternative 
Splice-Produkte darstelien. Wie in Fig. 8 gezeigt, lassen sich die Splice Varianten in 
zwei Gruppen einteilen: Deletionsvarianten und Insertionsvarianten. 

Den hTC- Varianten der Deletionsgruppe fehlen spezifische Sequenzabschnitte. Die 
36 bp in frame Deletion in Variante DELI resultiert hochstwahrscheinlich aus der 
Benutzung einer alternativen 3 '-Splice Akzeptorsequenz in Exon 6, wodurch ein Teil 
des RT Motivs 3 verlorengeht. In Variante DEL2 vverden die normalen S'-Splice 
. Donor- und 3'-Splice-Akzeptor Sequenzen von Intron 6, 7 und 8 nicht benutzt. 
Stattdessen wird Exon 6 direkt an Exon 9 fusioniert, wodurch eine Verschiebung des 
offenen Leserahmens entsteht und in Exon 10 ein Stopcodon auftritt. Variante Del3 
stellt eine {Combination aus Variante 1 und 2 dar. 

Die Gruppe der Insertions-Varianten zeichnet sich durch die Insertion von 
Intronsequenzen aus, die zu vorzeitigen Translationsstop fuhren. Anstelle der 
normalerweise benutzten S'-Splice Donorsequenz von Intron 5 wird eine alternative, 
3Mokalisierte Splicestelle in Variante INS1 benutzt, wodurch eine Insertion der 
ersten 38 bp aus Intron 4 zwischen Exon 4 und Exon 5 entsteht. Ebenso resultiert die 
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Insertion eines Intron 1 1-Sequenzbereichs in Variante INS2 aus der Benutzung einer 
alternativen S'-Splice Dbnorsequenz in Inlron 1 1. Da diese Variante in der Literatur 
(Kilian et al., 1997) nur unzureichend beschrieben wurde, lafit sich die genaue 
alternative 5 '-Splice Donorsequenz dieser Variante nicht bestimmen. Die Insertion 
von Intron 14 Sequenzen zwischen Exon 14 und Exon 15 in Variante INS3 entsteht 
durch die Benutzung von einer alternativen 3 '-Splice Akzeptorsequenz, wodurch der 
3'-Teil von Intron 14 nicht gesplict wird. 

Die in unserer Patentanmeldung PCT/EP/98/03469 beschriebene hTC- Variante INS4 
(Variante 4) zeichnet sich durch den Ersatz von Exon 15 und dem 5 ; -Teilbereich von 
Exon 16 durch die ersten 600 bp des Introns 14 aus. Diese Variante ist auf den 
Gebrauch einer alternativer internen S'-Splice Donorsequenz in Intron 14 und einer 
alternativen 3'-Splice Akzeptorsequenz in Exon 16 zuriickzufiihren, woraus ein 
veranderter C-Terminus resultiert. 

Die in v/w-Generation vvahrscheinlich nicht-funktioneller hTC-Proteinvarianten, die 
mit der Funktion des vollstandigen hTC-Proteins interferieren konnten, stellt 
zusatlich zur Transkriptionsregulation einen moglichen Mechanismus dar, urn die 
hTC-Proteinfunktion zu kontrollieren. Bis heute ist die Funktion der hTC- 
Splicevarianten nicht bekannt. Obwohl die meisten dieser Varianten vermutlich fiir 
Proteine ohne Reverse-Transkriptase-Aktivitat kodieren, konnten sie dennoch eine 
entscheidende Rolle als transdominant-negative Telomerase-Regulatoren spielen, 
indem sie z.B..um die Interaktion mit vvichtigen Bindungspartnern kompetieren. 

Die Suche nach moglichen Transkriptionsfaktorbindungstellen wurde mit dem „Find 
Pattern"-Algorithmuses aus dem „GCG Sequenz Analysis" Programmpacket der 
„Genetics Computer Group" (Madison, USA) durchgefiihrt. Dadurch vvurden 
verschiedene potentielle Bindungsstellen fiir Transkriptionsfaktoren in der 
Nukleotidsequenz von Intron 2 identifiziert, die in der Tab. 2 aufgelistet sind. 
Daruberhinaus wurde im Intron 1 eine Spl-Bindungsstelle (Pos. 43) und im 5'- 
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untranslatiertem Bereich eine c-Myc-Bindungsstelle (cDNA-Position 29-34, vergl. 
Fig. 6) gefunden. 

Beispiel 6 

5 

Um den oder die Startpunkt(e) der hTC-Transkription in HL 60 Zellen zu ermitteln, 
wurde das 5'-Ende der hTC-mRNA durch Primer-Extension- Analyse bestimmt. 

Es wurden 2 pg PolyA + -RNA aus HL-60-ZelIen fur 10 min bei 65°C denaturiert. Zur 

10 Primeranlagerung vvurden 1 pi RNasin (30-40 U/mi) und 0,3-1 pmol radioaktiv 
markierter Primer (5'GTTAAGTTGTAGCTTACACTGGTTCTC 3'; 2,5-8x1 0 5 
cpm) zugegeben und flir 30 min bei 37°C in einerii Gesamtvolumen von 20 pi 
inkubiert. Nach Zugabe von 10 pi SxReverse Transkriptase-Puffer (Fa. Gibco-BRL), 
2 10 mM dNTPs, 2 pi RNasin (s.o.), 5pl 0,1 M DTT (Fa. Gibco-BRL) 2 pi 

15 ThermoScript RT (15 U/pl; Fa Gibco-BRL) und 9 pi DEPC-behandeltes Wasser 
erfolgte die Primer- Verlangerung in einem Gesamtvolumen fur 1 h bei 58°C. Die 
Reaktion wurde durch 4 pi 0,5 M EDTA, pH 8,0, gestoppt und die RNA nach 
Zugabe von 1 pi RNaseA (10 mg/ml) fur 30 min bei 37°C abgebaut. Hierauf wurden 
2,5 pg gescherte Kalbsthymus-DNA und 100 \il TE addiert und einmal mit 150pl 

20 Phenol/Cloroform (1:1) extrahiert. Die DNA wurde unter Zusatz von 15 (.il 3 M Na- 
Acetat und 450 pi Ethanol fur 45 min bei -70°C gefallt und anschlieBend fur 15 min 
bei 14000 Upm abzentrifugiert. Das Prazipitat wurde einmal mit 70 %igem Ethanol 
gewaschen, luftgetrocknet und in 8 pi Sequenzierungs-Stoplosung gelost. Nach 5 
min Denaturierung bei 80°C wurden die Proben auf ein 6 %iges Polyacrylamidgel 

25 aufgetragen und elektrophoretisch (Ausubel et al., 1987) aufgetrennt (Fig. 5). 

Hierbei wurde eine Haupt-Transkriptionsstartstelle identifiziert, die 1767 bp 5' vom 
ATG-Startcodon der hTC-cDNA Sequenz lokalisiert ist (Nukleotidposition 3346 in 
Fig. 4). Die Nukleotidsequenz um diesen Haupttranskriptionsstart (TTA +1 TTGT) 
30 reprasentiert dariiberhinaus ein Initiator-Element (Inr), das in 6 von 7 Nukleotiden 
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mit dem Konsensusmotiv (PyPyA +l Na/tPyPy) (Smale, 1997) eines Initiator- 
Elementes iibereinstimmt. 

In unmittelbarer Nahe des experimentell identifizierten Haupt-Transkriptionsstartes 
5 konnte keine eindeutige TATA-Box identifiziert werden, so daB der hTC-Promoter 
wahrscheinlich in die Familie der TATA-losen Promotoren (Smale„ 1997) einzu- 
ordnen ist. Allerdings wurde durch Bioinformatik Analyse eine potentielle TATA- 
Box von Nukleotidposition 1306 bis 1311 (Fig. 4) gefunden. Die zusatzlich urn den 
Haupt-Transkriptionsstart beobachteten Neben-Transkriptionsstarts wurden auch bei 
10 anderen TATA-losen Promotoren beschrieben (Geng and Johnson, 1993), vvie z.B. in 
den stark regulierten Promotoren einiger Zellzyklusgene (Wick et al. y 1995). 

Beispiel 7 

15 Zusatzlich zu dem in Beispiel 6 beschriebenen, in HL60 Zellen identifizierten 
Startpunkt des hTC Transkriptes, wurde ein weiterer Transkriptionsstartbereich in 
HL60 Zellen identifiziert Anhand von RT-PCR-Analysen wurde die Region des 
Transkriptionsstarts des hTC-Gens in HL60 Zellen auf die bp -60 bis -105 
eingegrenzt. 

20 

Unter Einsatz von 0,4 jig Poly A-RNA aus HL60 Zellen (Clontech) und dem 
genspezifischen Primer GSP13 (5 ' -CCTCC A A AG AGGTGGCTTCTTCGGC-3 * , 
cDNA-Position 920-897) wurde hierfur die cDNA mit Hilfe des „First Strand cDNA- 
Synthesis Kit" (Clontech) nach Angaben der Hersteller synthetisiert. In einem 

25 Endvolumen von 50 \i\ wurden 1 |il cDNA mit 10 pmol dNTP-Mix versetzt und in 
1 xPCR-Reaktionspuffer F (PCR-Optimizer Kit der Fa. InVitrogen) und einem Unit 
Platinum-Taq-DNA Polymerase (Fa. Gibco/BRL) eine PCR-Reaktion durchgefuhrt. 
Als Primer wurden jeweils 10 pmol der nachfolgend defmierten 5'- und 3 ; -Primer 
zugefugt. Die PCR wurde in 3 Schritten durchgefuhrt. An eine zweiminutige Dena- 

30 turierung bei 94°C schlossen sich 36 PCR-Zyklen an, in denen die DNA zunachst fur 
45 sec bei 94°C denaturiert wurde und anschlieBend fur 5 min bei 68°C die Primer 
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angelagert und die DNA-Kette verlangert wurde. Zum AbschluB folgte fur 1 0 min 
eine Kettenverlangening bei 68°C. Insgesamt wurden seehs verschiedene 5'-PCR 
Primer (Primer HTRT5B: 5'-CGCAGCCACTACCGCGAGGTGC-3\ cDNA- 
Position 105 bis 126; Primer CSS: 5 '-CTGCGTCCTGCTGCGCACGTGGGAAGC- 
5. 3', 5'-flankierende Region -49 bis -23; Primer PRO-TEST1: 5'- 
CTCGCGGCGCGAGTTTC AGGC AG-3 s , 5'-flankierende Region -74 bis -52; 
Primer PRO-TEST2: 5'-CCAGCCCCTCCCCTTCCTTTCC-3\ 5'-flankierende 
Region -1 12 bis -91; Primer PRO-TEST4: 5'-CCAGCTCCGCCTCCTCCGCGC-3\ 
5'-flankierende Region -191 - -171; Primer RP-3A: 5'- 

10 CTAGGCCG ATTCGACCTCTCTCC-3 ' , 5'-flankierende Region -427 bis -405) mit 
dem 3'-PCR Primer CSRruck (5 l -GTCCCAGGGCACGCACACCAG-3\ cDNA- 
Position 245 bis 225) kombiniert. Als Kontrolle wurde zusatzlich zu den Oligo-dT- 
und GSP13-geprimten cDNAs auch genomische DNA fur die PCR eingesetzt. Wie in 
Fig. 9 gezeigt, wurde nur mit den Primerkombinationen HTRT5B-C5Rriick, C5S- 

1 5 CSRriick und PRO-TEST1 -CSRruck ein PCR-Produkt erhalten, was darauf hinweist, 
daB der Startpunkt der hTC-Transkription in der Region zwischen bp-60 und bp- 105 
liegt. 

Beispiel 8 

20 

In der ca. 11,2 kb isolierten 5 l -flankierenden Region des hTC-Gens befinden sich 
mehrere extrem GC-reiche Bereiche, sog. CpG Islands. Ein CpG Islands mit einem 
GC-Gehalt von > 70 % reicht von bp - 1214 bis in Intron 2. Zwei weitere GC-reiche 
Bereiche mit einem GC-Gehalt von > 60 % reichen von bp -3872 bis bp -3113 bzw. 
25 bp -5363 bis bp -3941. Die Lage der CpG Islands ist in der Fig. II graphisch 
dargestellt. 

Die Suche nach moglichen Transkriptionsfaktorbindungstellen wurde mit dem „Find 
Pattern"-Algorithmuses aus dem „GCG Sequenz Analysis" Programmpacket der 
30 „Genetics Computer Group" (Madison, USA) durchgefiihrt. Dadurch wurden 
verschiedene potentielle Bindungsstellen in der Region bis -900 bp upstream vom 
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Translations-Startcodon ATG indentifiziert: funf Spl-Bindungsstellen, eine c-Myc- 
Bindungsstelle, eine CCAC-Box (Fig. 10). Zusatzlich wurden eine CCAAT-Box und 
eine zweite c-Myc-Bindungsstelle an den Positionen -1788 bzw. -3995 der 5'- 
flankierenden Region gefunden. 

5. 

Beispiel 9 

Urn die Aktivitat des hTC-Promotors zu analysieren, wurden durch PCR-Ampli- 
fikation vier verschieden lange hTC-Promotorsequenzabschnitte generiert und 5 l vor 

10 ^ das Reportergen Luziferase in den Vektor pGL2 der Fa. Promega kloniert. Als DNA- 
Quelle fur die PCR-Amplifikation wurde das aus dem Phagenklon P12 subklonierte, 
8,5 kb groBe Sacl-Fragment gevvahlt. In einem Endvolumen von 50 \x\ vvurden 35 ng 
dieser DNA mit 10 pmol dNTP-Mix versetzt und in lxPCR-Reaktionspuffer (PCR- 
Optimizer Kit der Fa. InVitrogen) und einem Unit Platinum-Taq-DNA Polymerase 

15 (Fa. Gibco/BRL) eine PCR-Reaktion durchgefiihrt. Als Primer vvurden jeweils 
20 pmol der nachfolgend definierten 5'- und 3'-Primer zugefugt. Die PCR wurde in 3 
Schritten durchgefiihrt. An eine zweiminiitige Denaturierung bei 94°C schlossen sich 
30 PCR-Zyklen an, in denen die DNA zunachst fur 45 sec bei 94°C denaturiert 
wurde und anschlieBend fur 5 min bei 68°C die Primer angelagert und die DNA- 

20 Kette verlangert wurde. Zum AbschluB folgte fur 10 min eine Kettenverlangerung 
bei 68°C. Als 3'-PCR-Primer wurde jeweils der Primer PK-3A (5 4 - 
GC A AGCTTG ACGC AGCGCTGCCTG A AACTCG-3 ' , Position -43 bis -65) ge- 
wahlt, der einen Sequenzbereich 42 bp upstream vom START-Codon ATG erkennt. 
Durch Kombination des PK-3A-Primers mit dem 5'-PCR-Primer PK-5B (5 C - 

25 CC AG ATCTCTGG A AC AC AG AGTGGC AGTTTCC-3 c , Position ^093 bis -4070) 
wurde ein 4051 bp grofies Promotor-Fragment amplifizierl (NPK8). Die 
Kombination des Primerpaares PK-3A und PK-5C (5 4 - 
CCAGATCTGCATGAAGTGTGTGGGGATTTGCAG-3 1 , Position -3120 bis- 
3096) fiihrte zur Amplifikation eines 3078 bp groBen Promotorfragmentes (NPK15). 

30 Ein 2068 bp grofies Promotorfragment wurde durch die Verwendung der Primer- 
kombination PK-3A und PK-5D (5'- 
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GGAG ATCTG ATCTTGGCTTACTGC AGCCTCTG-3 4 , Position -2110 bis -2087) 
amplifeiert (NPK22). Der Einsatz der Primerkombination PK-3A und PK-5E (5*- 
, GG AG ATCTGTCTGG ATTCCTGGG A AGTCCTC A-3 * , Position -1 125 bis -1 102) 
fiihrte schlieBlich zur Amplifikation eines 1083 bp groBen Promotorfragmentes 
5 (NPK27). Der PK-3A Primer enthalt eine Hindlll Erkennungssequenz. Die 
verschiedenen S'-Primer enthalten eine Bglll-Erkennungssequenz. 

Die entstandenen PCR-Produkte wurden mit Hilfe des QIA^ -quick spin PCR 
. Purification Kits der Fa. Qiagen nach Angaben der Hersteller aufgereinigt und 

10 anschlieBend mit den Restriktionsenzymen Bglll und Hindlll verdaut. Mit den 
gleichen Restriktionsenzymen wurde der pGL2-Promotor- Vektor verdaut und der in 
diesem Vektor enthaltene SV40-Promotor freigesetzt und abgetrennt. Die PCR- 
Promotorfragmente wurden in den Vektor ligiert ? in kompetente DH5a-Bakterien der 
Fa. Gibco/BRL transformiert. Aus transformierten Bakterienklonen wurde DNA fur 

15 die nachfolgend beschriebenen Promotor-Aktivitats-Analysen mit Hilfe des Qiagen 
Plasmid-Kits der Fa. Qiagen isoliert. 

Beispiel 10 

20 Die Aktivitat des hTC-Promotors wurde in transienten Transfektionen in 
eukaryotischen Zellen analysiert. 

Alle Arbeiten mit eukaryotischen Zellen erfolgten an einem sterilen Arbeitsplatz. 
CHO-K1 und HEK 293 Zellen wurden von der American Type Culture collection 
25 bezogen. 

CHO-K1 Zellen wurden in DMEM Nut Mix F-12 Zellkulturmedium (Fa. Gibco- 
BRL, Bestellnummer: 21331-020) mit 0,15% Streptomycin/Penezillin, 2mM 
Glutamin und 10 % FCS (Fa. Gibco-BRL) gehalten. 

30 
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HEK 293 Zellen wurden in DMOD Zellkulturmedium (Fa. Gibco-BRL, Bestell- 
nummer: 41965-039) mit 0,15 % Streptomycin/Penizillin, 2 mM Glutamin und 10 % 
FCS (Fa. Gibco-BRL) kultiviert. 

5 CHO-K1 und HEK 293 Zellen wurden in wasssergesattigter Atmosphare bei 37°C 
unter. Begasung mit 5 % C0 2 kultiviert. Bei konfluentem Zellrasen wurde das 
Medium abgesaugt, die Zellen mit PBS (100 mM KH 2 P0 4 pH 7,2; 150 mM NaCl) 
gewaschen und durch Zugabe einer Trypsin-EDTA Losung (Fa. Gibco-BRL) 
abgelost. Das Trypsin wurde durch Mediumzugabe inaktiviert und die Zellzahl mit 
10 einer Neubauer-Zahlkammer ermittelt, urn die Zellen in gewiinschter Dichte auszu- 
plattieren. 

Fur die Transfektion wurden pro Well jeweils 2x 10 5 -HEK 293 Zellen in einer 24- 
well Zellkulturplatte ausplattiert. Nach 3 Stunden wurde das HEK 293 Medium 

15 entfemt. Fiir die Transfektion wurden bis zu 2,5 |ig Plasmid-DNA, 1 ^g eines CMV 
B-Gal Plasmidkonstruktes (Fa. Stratagene, Bestellnummer: 200388), 200 ^il serum- 
freies Medium und 10|il Transfektionsreagenz (DOTAP der Fa. Boehringer 
Mannheim) fiir 1 5 Minuten bei Raumtemperatur inkubiert und anschliefiend auf die 
HEK 293 Zellen gleichmafiig aufgetropft. Nach 3 Stunden wurden 1,5 ml Medium 

20 hinzugegeben. Nach 20 Stunden wurde das Medium gewechselt. Nach weiteren 24 
Stunden wurden die Zellen zur Bestimmung der Luziferase- und der 6-Gal-Aktivitat 
geerntet. Dazu wurden die Zellen im Zellkultur-Lysisreagenz (25 mM Tris [pH 7,8] 
mit H 3 P0 4 ; 2 mM CDTA; 2 mM DTT; 10% Glycerol; 1% Triton X-100) fur 15 
Minuten bei Raumtemperatur lysiert. Zwanzig \xl dieses Zellysats wurden mit 100 \xl 

25 Luziferase-Assaypuffer (20 mM Tricin; 1,07 mM (MgC0 3 ) 4 Mg(OH) 2 '5H 2 0; 
2,67 mM MgSO,; 0,1 mM EDTA; 33,3 mM DTT; 270 ^M Coenzym A; 470 \iM 
Luciferin, 530 jiM ATP) gemischt und das durch die Luziferase generierte Licht 
gemessen. 

30 Zur Messung der B-Galaktosidaseaktivitat wurden gleiche Mengen Zellysat und (5- 
Galaktosidase-Assaypuffer (100 mM Natriumphosphatpuffer pH 7,3; I mM MgCl 2 ; 
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50 mM fi-Merkaptoethanol; 0,665 mg/ml ONPG) fur mindestens 30 Minuten bei 
37°C oder bis eine leichte Gelbfarbung auftrat, inkubiert. Die Reaktion wurde durch 
Zugabe von 100 \il 1 M Na 2 C0 3 gestoppt und die Absorption bei 420 nm bestimmt. 

Fur die Analyse des hTC-Promotors wurden vier verschieden lange hTC-Promotor- 
sequenzabschnitte 5' vor das Reportergen Luziferase kloniert (vergl. Beispiel 9). 

In der Fig. 11 sind die relativen Luziferase Aktivitaten zweier unabhangiger 
Transfektionen mit den Konstrukten NPK8, NPK15, NPK22 und NPK27 in HEK 
293 Zellen aufgetragen. Jedes Experiment wurde in Duplikaten durchgeflihrt. 
Dariiberhinaus wurde die Standardabweichung angegeben. Das Konstukt NPK 27 
zeigt eine 40fach hohere Luziferaseaktivitat als die Basalaktivitat des promotorlosen 
Luziferase-Kontrollkonstrutes (pGL2-basic) und eine 2 bis 3fach hohere Aktivitat als 
das SV40 Promotorkontroll-Konstrukt (pGL2PRO). Interessanterweise wurde im 
Vergleich zu dem Konstrukt NPK27 eine 2 bis 3fach geringere Luziferaseaktivitat in 
mit langeren hTC Promotorkonstukten (NPK8, NPK15, NPK22) transfizierten Zellen 
beobachtet. Ahnliche Ergebnisse wurden auch in CHO Zellen beobachtet (Daten 
nicht gezeigt). 
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Patentanspruche 

1. Regulatorische DNA-Sequenzen fur das Gen der humanen katalytischen 
Telomerase-Untereinheit. 

2. DNA-Sequenzen gemafi Anspruch 1 , dadurch gekennzeichnet, daB es sich urn 
Intronsequenzen gemaB SEQ ID NO 4, 5, 6, 7, 8, 9, 10, 1 1, 12, 13, 14, 15, 16, 
17, 18, 19 und/oder 20 oder um regulatorisch wirksame Fragmente dieser 
Sequenzen handelt. 

3. DNA-Sequenzen gemaB Anspruch 1, dadurch gekennzeichnet, daB es sich um 
die 5'-flankierende regulatorische DNA-Sequenz fur das Gen der humanen 
•katalytischen Telomerase-Untereinheit gemaB Fig. 10 (SEQ ID NO 3) oder 
um regulatorisch wirksame Fragmente dieser DNA-Sequenz handelt. 

4. Rekombinantes Konstrukt, enthaltend eine DNA-Sequenz gemaB einem der 
Anspruche 1 bis 3. 



5. Rekombinantes Konstrukt gemaB Anspruch 4, dadurch gekennzeichnet, daB 
20 es weiterhin eine oder mehrere DNA-Sequenzen enthalt, die fur Polypeptide 

oder Proteine kodieren. 

6. Vektor, enthaltend ein rekombinantes Konstrukt gemaB Anspruch 4 oder 5. 

25 7. Verwendung von rekombinanten Konstrukten bzw. Vektoren gemaB einem 
der Anspruche 4 bis 6 zur Herstellung von Arzneimitteln. 

8. Rekombinante Wirtszellen, enthaltend rekombinante Konstrukte bzw. Vek- 
toren gemaB einem der Anspruche 4 bis 6. 
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9. Verfahren zur Identifizierung von Substanzen, die die Promoter-, Silencer- 
oder Enhanceraktivitat der humanen katalytischen Telomerase-Untereinheit 
beeinflusseh, das folgende Schritte umfaBt: 

A. Zugabe einer Kandidatensubstanz zu einer Wirtszelle, enthaltend 
DNA-Sequenzen gemafi einem der Anspriiche 1 bis 3, funktionell 
verknupft mit einem Reportergen, 

B. Messung des Substanzeffektes auf die Reportergenexpression. 

10. Verfahren zur Identifizierung von Faktoren, die spezifisch an die DNA gemaB 
einem der Anspriiche 1 bis 3 oder an Fragmente davon binden, dadurch 
gekennzeichnet, daB man eine Expressions-cDNA-Bibliothek mit einer DNA- 
Sequenz gemaB einem der Anspriiche 1 bis 3 oder Teilfragmenten unter- 
schiedlichster Lange als Sonde screent. 

1 1. Transgene Tiere, enthaltend rekombinante Konstrukte bzw. Vektoren gemaB 
Anspruchen 4 bis 6. 

12. Verfahren zur Detektion Telomerase-assoziierter Zustande bei einem 
Patienten, das folgende Schritte umfaBt: 

A. Inkubation eines rekombinanten Konstruktes bzw. Vektors gemaB 
Anspruchen 4 bis 6 das bzw. der zusatzlich ein Reportergen enthalt 
mit Korperfliissigkeiten oder zellularen Proben, 

B. Detektion der Reportergenaktivitat, um einen diagnostischen Wert zu 
erhalten, 
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C. Vergleich des diagnostischen Wertes mit Standardwerten fur das 



Reportergenkonstrukt in standardisierten normalen Zellen oder 
Korperflussigkeiten des gleichen Typs wie die Testprobe. 
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Fig. 4 

GAGCTCTGAA CCGTGGAAC GAACATGACC CTTGCCTGCC TGCTTCCCTG GGTGGGTCAA GGGTAATGAA 70 
GTGGTGTGCA GGAAATGGCC ATGTAAATTA CACGACTCTG CTGATGGGGA CCGTTCCTTC CAXCATTATT 140 
CATCTTCACC CCCAAGGACT GAATGATTCC AGCAACTTCT TCGGGTGTGA CAAGCCATGA CAAAACTCAG 210 
TACAAACACC ACTCTTTTAC TAGGCCCACA GAGCACGGGC CACACCCCTG ATATATTAAG AGTCCAGGAG 280 
AGATGAGGCT GCTTTCAGCC ACCAGGCTGG GGTGACAACA GCGGCTGAAC AGTCTGTTCC TCTAGACTAG 350 
TAGACCCTGG CAGGCACTCC CCCAAATTCT AGGGCCTGGT TGCTGCTTCC CGAGGGCGCC ATCTGCCCTG 420 
GAGACTCAGC CTGGGGTGCC ACACTGAGGC CAGCCCTGTC TCCACACCCT CCGCCTCCAG GCCTCAGCTT 490 
CTCCAGCAGC TTCCTAAACC CTGGGTGGGC CGTGTTCCAG CGCTACTGTC TCACCTGTCC CACTGTGTCT 560 
TGTCTCAGCG ACGTAGCTCG CACGGTTCCT CCTCACATGG GGTGTCTGTC TCCTTCCCCA ACACTCACAT 630 
GCGTTGAAGG GAGGAGATTC TGCGCCTCCC AGACTGGCTC CTCTGAGCCT GAACCTGGCT CGTGGCCCCC 700 
GATGCAGGTT CCTGGCGTCC GGCTGCACGC TGACCTCCAT TTCCAGGCGC TCCCCGTCTC CTGTCATCTG 770 
CCGGGGCCTG CCGGTGTGTT CTTCTGTTTC TGTGCTCCTT TCCACGTCCA GCTGCGTGTG TCTCTGCCCG 840 
CTAGGGTCTC GGG GTT T T T A TAGGCATAGG ACGGGGGCGT GGTGGGCCAG GGCGCTCTTG GGAAATGCAA 910 
CATTTGGGTG TGAAAGTAGG AGTGCCTGTC CTCACCTAGG TCCACGGGCA CAGGCCTGGG GATGGAGCCC 980 
CCGCCAGGGA CCCGCCCTTC TCTGCCCAGC ACTTTCCTGC CCCCCTCCCX CTGGAACACA GAGTGGCAGT 1050 
TTCCACAAGC ACTAAGCATC CTCTTCCCAA AAGACCCAGC ATTGGCACCC CTGGACATTT GCCCCACAGC 1120 
CCTGGGAATT CACGTGACTA CGCACATCAT GTACACACTC CCGTCCACGA CCGACCCCCG CTGTTTTATT 1190 
TTAATAGCTA CAAAGCAGGG AAATCCCTGC TAAAATGTCC TTTAACAAAC TGGTTAAACA AACGGGTCCA 1260 
TCCGCACGGT GGACAGTTCC TCACAGTGAA GAGGAACATG CCGTTTATAA AGCCTGCAGG CATCTCAAGG 1330 
GAATTACGCT GAGTCAAAAC TGCCACCTCC ATGGGATACG TACGCAACAT GCTCAAAAAG AAAGAATTTC 1400 
ACCCCATGGC AGGGGAGTGG TTAGGGGGGT TAAGGACGGT GGGGGCGGCA GCTGGGGGCT ACTGCACGCA 1470 
CCTTTTACTA' AAGCCAGTTT CCTGGTTCTG ATGGTATTGG CTCAGTTATG GGAGACTAAC CATAGGGGAG 1540 
TGGGGATGGG GGAACCCGGA GGCTGTGCCA TCTTTGCCAT GCCCGAGTGT CCTGGGCAGG ATAATGCTCT 1610 
AGAGATGCCC ACGTCCTGAT TCCCCCAAAC CTGTGGACAG AACCCGCCCG GCCCCAGGGC CTTTGCAGGT 1680 
GTGATCTCCG TGAGGACCCT GAGGTCXGGG ATCCTTCGGG ACTACCTGCA GGCCCGAAAA GTAATCCAGG 1750 
GGTTCTGGGA AGAGGCGGGC AGGAGGGTCA GAGGGGGGCA GCCTCAGGAC GATGGAGGCA GTCAGTCTGA 1820 
GGCTGAAAAG GGAGGGAGGG CCTCGAGCCC AGGCCTGCAA GCGCCTCCAG AAGCTGGAAA AAGCGGGGAA 1890 
GGGACCCTCC ACGGAGCCTG CAGCAGGAAG GCACGGCTGG CCCTTAGCCC ACCAGGGCCC ATCGTGGACC 1960 
TCCGGCCTCC GTGCCATAGG AGGGCACTCG CGCTGCCCTT CTAGCATGAA GTGTGTGGGG ATTTGCAGAA 2030 
GCAACAGGAA ACCCATGCAC TGTGAATCTA GGATTATTTC AAAACAAAGG TTTACAGAAA CATCCAAGGA 2100 
CAGGGCTGAA GTGCCTCCGG GCAAGGGCAG GGCAGGCACG AGTGATTTTA TTTAGCTATT TTATTTTATT 2170 
TACTTACTTT CTGAGACAGA GTTATGCTCT TGTTGCCCAG GCTGGAGTGC AGCGGCATGA TCTTGGCTCA 2240 
CTGCAACCTC CGTCTCCTGG GTTCAAGCAA TTCTCGTGCC TCAGCCTCCC AAGTAGCTGG GATTTCAGGC 2310 
GTGCACCACC ACACCCGGCT AATTTTGTAT TTTTAGTAGA GATGGGCTTT CACCATGTTG GTCAAGCTGA 2380 
TCTCAAAATC CTGACCTCAG GTGATCCGCC CACCTCAGCC TCCCAAAGTG CTGGGATTAC AGGCATGAGC 2450 
CACTGCACCT GGCCTATTTA ACCATTTTAA AACTTCCCTG GGCTCAAGTC ACACCCACTG GTAAGGAGTT 2520 
CATGGAGTTC AATTTCCCCT TTACTCAGGA GTTACCCTCC TTTGATATTT TCTGTAATTC TTCGTAGACT 2590 
GGGGATACAC CGTCTCTTGA CATATTCACA GTTTCTGTGA CCACCTGTTA TCCCATGGGA CCCACTGCAG 2660 
GGGCAGCTGG GAGGCTGCAG GCTTCAGGTC CCAGTGGGGT TGCCATCTGC CAGTAGAAAC CTGATGTAGA 2730 
ATCAGGGCGC AAGTGTGGAC ACTGTCCTGA ATCTCAATGT CTCAGTGTGT GCTGAAACAT GTAGAAATTA 2800 
AAGTCCATCC CTCCTACTCT ACTGGGATTG AGCCCCTTCC CTATCCCCCC CCAGGGGCAG AGGAGTTCCT 2870 
CTCACTCCTG TGGAGGAAGG AATGATACTT TGTTATTTTT CACTGCTGGT ACTGAATCCA CTGTTTCATT 2940 
TGTTGGTTTG TTTGTTTTGT TTTGAGAGGC GGTTTCACTC TTGTTGCTCA GGCTGGAGGG AGTGCAATGG 3010 
CGCGATCTTG GCTTACTGCA GCCTCTGCCT CCCAGGTTCA AGTGATTCTC CTGCTTCCGC CTCCCATTTG 3080 
GCTGGGATTA CAGGCACCCG CCACCATGCC CAGCTAATTT TTTGTATTTT TAGTAGAGAC GGGGGTGGGT 3150 
GGGGTTCACC ATGTTGGCCA GGCTGGTCTC GAACTTCTGA CCTCAGATGA TCCACCTGCC TCTGCCTCCT 3220 
AAAGTGCTGG GATTACAGGT GTGAGCCACC ATGCCCAGCT CAGAATTTAC TCTGTTTAGA AACATCTGGG 3290 
TCTGAGGTAG GAAGCTCACC CCACTCAAGT GTTGTGGTGT TTTAAGCCAA TGATAGAATT TTTTTATTGT 3360 
TGTTAGAACA CTCTTGATGT TTTACACTGT GATGACTAAG ACATCATCAG CTTTTCAAAG ACACACTAAC 3430 
TGCACCCATA ATACTGGGGT GTCTTCTGGG TATCAGCAAT CTTCATTGAA TGCCGGGAGG CGTTTCCTCG 3500 
CCATGCACAT GGTGTTAATT ACTCCAGCAT AATCTTCTGC TTCCATTTCT TCTCTTCCCT CTTTTAAAAT 3570 
TGTGTTTTCT ATGTTGGCTT CTCTGCAGAG AACCAGTGTA AGCTACAACT TAACTTTTGT TGGAACAAAT 3640 
TTTCCAAACC GCCCCTTTGC CCTAGTGGCA GAGACAAITC ACAAACACAG CCCTTTAAAA AGGCTTAGGG 3710 
ATCACTAAGG GGATTTCTAG AAGAGCGACC TGTAATCCTA AGTATTTACA AGACGAGGCT AACCTCCAGC 3780 
GAGCGTGACA GCCCAGGGAG GGTGCGAGGC CTGTTCAAAT GCTAGCTCCA TAAATAAAGC AATTTCCTCC 3850 
GGCAGTTTCT GAAAGTAGGA AAGGTTACAT TTAAGGTTGC GTTTGTTAGC ATTTCAGTGT TTGCCGACCT 3920 
CAGCTACAGC ATCCCTGCAA GGCCTCGGGA GACCCAGAAG TTTCTCGCCC CCTTAGATCC AAACTTGAGC 3990 
AACCCGGAGT CTGGATTCCT GGGAAGTCCT CAGCTGTCCT GCGGTTGTGC CGGGGCCCCA GGTCTGGAGG 4060 
GGACCAGTGG CCGTGTGGCT TCTACTGCTG GGCTGGAAGT CGGGCCTCCT AGCTCTGCAG TCCGAGGCTT 4130 
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CACAGCCTAG GCCGATTCGA CCTCTCTCCG CTGGGGCCCT CGCTGGCGTC CCTGCACCCT GGGRGCGCGA 4760 
GCGGCGCGCG GGCGGGGAAG CGCGGCCCAG ACCCCCGGGT CCGCCCGGAG CAGCTGCGCT GTCGGGGCCA 4830 
GGCCGGGCTC CCAGTGGATT CGCGGGCACA GACGCCCAGG ACCGCGCTCC CCACGTGGCG GAGGGACTGG 4900 
GGACCCGGGC ACCCGTCCTG CCCCTTCACC TTCCAGCTCC GCCTCCTCCG CGCGGACCCC GCCCCGTCCC 4970 
GACCCCTCCC GGGTCCCCGG CCCAGCCCCC TCCGGGCCCT CCCAGCCCCT CCCCTTCCTT TCCGCGGCCC 5040 
CGCCCTCTCC TCGCGGCGCG AGTTTCAGGC AGCGCTGCGT CCTGCTGCGC ACGTGGGAAG CCCTGGCCCC 5110 
GGCCACCCCC GCGATG 5126 
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Fig. 6 

GTTTCAGGCA GCGCT6CGTC CTGCTGCGCA CGTGGGAAGC CCTGGCCCCG GCCACCCCCG CGATGCCGCG 70 
CGCTCCCCGC TGCCGAGCCG TGCGCTCCCT GCTGCGCAGC CACTACCGCG AGGTGCTGCC GCTGGCCACG 140 
TTCGTGCGGC GCCTGGGGCC CCAGGGCTGG CGGCTGGTGC AGCGCGGGGA CCCGGCGGCT TTCCGCGCGC 210 
TGGTGGCCCA GTGCCTGGTG TGCGTGCCCT GGGACGCACG GCCGCCCCCC GCCGCCCCCT CCTTCCGCCA 280 
GGTGTCCTGC CTGAAGGAGC TGGTGGCCCG AGTGCTGCAG AGGCTGTGCG AGCGCGGCGC GAAGAACGTG 350 
CTGGCCTTCG GCTTCGCGCT GCTGGACGGG GCCCGCGGGG GCCCCCCCGA GGCCTTCACC ACCAGCGTGC 420 
GCAGCTACCT GCCCAACACG GTGACCGACG CACTGCGGGG 6AGCGGGGCG TGGGGGCTGC TGCTGCGCCG 490 
CGTGGGCGAC GACGTGCTGG TTCACCTGCT GGCACGCTGC GCGCTCTTTG TGCTGGTGGC TCCCAGCTGC 560 
GCCTACCAGG TGTGCGGGCC GCCGCTGTAC CAGCTCGGCG CTGCCACTCA GGCCCGGCCC CCGCCACACG 630 
CTAGTGGACC CCGAAGGCGT CTGGGAXGCG AACGGGCCTG GAACCATAGC GTCAGGGAGG CCGGGGTCCC 700 
CCTGGGCCTG CCAGCCCCGG GTGCGAGGAG GCGCGGGGGC AGTGCCAGCC GAAGTCTGCC GTTGCCCAAG 770 
AGGCCCAGGC GTGGCGCTGC CCCTGAGCCG GAGCGGACGC CCGTTGGGCA GGGGTCCTGG GCCCACCCGG 640 
GCAGGACGCG TGGACCGAGT GACCGTGGTT TCTGTGTGGT GTCACCTGCC AGACCCGCCG AAGAAGCCAC 910 
CTCTTTGGAG GGTGCGCTCT CTGGCACGCG CCACTCCCAC CCATCCGTGG GCCGCCAGCA CCACGCGGGC 980 
CCCCCATCCA CATCGCGGCC ACCACGTCCC TGGGACACGC CTTGTCCCCC GGTGTACGCC GAGACCAAGC 1050 
ACrrCCTCTA CTCCTCAGGC GACAAGGAGC AGCTGCGGCC CTCCTTCCTA CTCAGCTCTC TGAGGCCCAG 1120 
CCTGACTGGC GCTCGGAGGC TCGTGGAGAC CATCTTTCTG GGTTCCAGGC CCTGGATGCC AGGGACTCCC 1190 
CGCAGGTTGC CCCGCCTGCC CCAGCGCTAC TGGCAAATGC GGCCCCTGTT TCTGGAGCTG CTTGGGAACC 1260 
ACGCGCAGTG CCCCTACGGG GTGCTCCTCA AGACGCACTG CCCGCTGCGA GCTGCGGTCA CCCCAGCAGC 1330 
CGGTGTCTGT GCCCGGGAGA AGCCCCAGGG CTCTGTGGCG GCCCCCGAGG AGGAGGACAC AGACCCCCGT 1400 
CGCCTGGTGC AGCTGCTCCG CCAGCACAGC AGCCCCTGGC AGGTGTACGG CTTCGTGCGG GCCTGCCTGC 1470 
GCCGGCTGGT GCCCCCAGGC CTCTGGGGCT CCAGGCACAA CGAACGCCGC TTCCTCAGGA ACACCAAGAA 1540 
GTTCATCTCC CTGGGGAAGC ATGCCAAGCT CTCGCTGCAG GAGCTGACGT GGAAGATGAG CGTGCGGGAC 1610 
TGCGCTTGGC TGCGCAGGAG CCCAGGGGTT GGCTGTGTTC CGGCCGCAGA GCACCGTCTG C GTGAGG AGA 1680 
TCCTGGCCAA GTTCCTGCAC TGGCTGATGA GTGTGTACGT CGTCGAGCTG CTCAGGTCTT TCTTTTATGT 1750 
CACGGAGACC ACGTTTCAAA AGAACAGGCT CTTTTTCTAC CGGAAGAGTG TCTGGAGCAA GTTGCAAAGC 1820 
AITGGAATCA GACAGCACTT GAAGAGGGTG CAGCTGCGGG AGCTGTCGGA AGCAGAGGTC AGGCAGCATC 1890 
GGGAAGCCAG GCCCGCCCTG CTGACGTCCA GACTCCGCTT CATCCCCAAG CCTGACGGGC TGCGGCCGAI 1960 
TSTGAACATG GACTACGTCG TGGGAGCCAG AACGTTCCGC AGAGAAAAGA GGGCCGAGCG TCTCACCTCG 2030 
AGGGTGAAGG CACTGTTCAG CGTGCTCAAC TACGAGCGGG CGCGGCGCCC CGGCCTCCTG GGCGCCTCTG 2100 
TGCTGGGCCT GGACGAIATC CACAGGGCCT GGCGCACCTT CGTGCTGCGT GTGCGGGCCC AGGACCCGCC 2170 
GCCTGAGCTG TACTTTGTCA AGGTGGATGT GACGGGCGCG TACGACACCA TCCCCCAGGA CAGGCTCACG 2240 
GAGGTCATCG CCAGCATCAT CAAACCCCAG AACACGTACT GCGTGCGTCG GTATGCCGTG GTCCAGAAGG 2310 
CCGCCCATGG GCACGTCCGC AAGGCCTTCA AGAGCCACGT CTCTACCTTG ACAGACCTCC AGCCGTACAT 2380 
GCGACAGTTC GTGGCTCACC TGCAGGAGAC CAGCCCGCTG AGGGATGCCG TCGTCATCGA GCAGAGCTCC 2450 
TCCCTGAATG AGGCCAGCAG TGGCCTCTTC GACGTCTTCC TACGCTTCAT GTGCCACCAC GCCGTGCGCA 2520 
TCAGGGGCAA GTCCTACGTC CAGTGCCAGG GGATCCCGCA GGGCTCCATC CTCTCCACGC TGCTCTGCAG 2590 
CCTGTGCTAC GGCGACATGG AGAACAAGCT GTTTGCGGGG ATTCGGCGGG ACGGGCTGCT CCTGCGTTTG 2660 
GTGGATGATT TCTTGTTGGT GACACCTCAC CTCACCCACG CGAAAACCTT CCTCAGGACC CTGGTCCGAG 2730 
GTGTCCCTGA GTATGGCTGC GTGGTGAACT TGCGGAAGAC AGTGGTGAAC TTCCCTGTAG AAGACGAGGC 2800 
CCTGGGTGGC ACGGCTTTTG TTCAGATGCC GGCCCACGGC CTATTCCCCT GGTGCGGCCT GCTGCTGGAT 2870 
ACCCGGACCC TGGAGGTGCA GAGCGACTAC TCCAGCTATG CCCGGACCTC CAICAGAGCC ACTCTCACCT 2940 
TCAACCGCGG CTTCAAGGCT GGGAGGAACA TGCGTCGCAA ACTCTTTGGG GTCTTGCGGC TGAAGTGTCA 3010 
CAGCCTGTTT CTGGATTTGC AGGTGAACAG CCTCCAGACG GTGTGCACCA ACATCTACAA GATCCTCCTG 3080 
CTGCAGGCGT ACAGGTTTCA CGCATGTGTG CTGCAGCTCC CATTICATCA GCAAGTTTGG AAGAACCCCA 3150 
CATTTTTCCT GCGCGTCATC TCTGACACGG CCTCCCTCTG CTACTCCATC CTGAAAGCCA AGAACGCAGG 3220 
GAIGTCGCTG GGGGCCAAGG GCGCCGCCGG CCCTCTGCCC TCCGAGGCCG TGCAGTGGCT GTGCCACCAA 3290 
GCATTCCTGC TCAAGCTGAC TCGACACCGT GTCACCXACG TGCCACTCCT GGGGTCACTC AGGACAGCCC 3360 
AGACGCAGCT GAGTCGGAAG CTCCCGGGGA CGACGCTGAC TGCCCTGGAG GCCGCAGCCA ACCCGGCACT 3430 
GCCCTCAGAC TTCAAGACCA TCCTGGACTG ATGGCCACCC GCCCACAGCC AGGCCGAGAG CAGACACCAG 3500 
CAGCCCTGTC ACGCCGGGCT CTACGTCCCA GGGAGGGAGG GGCGGCCCAC ACCCAGGCCC GCACCGCTGG 3570 
GAGTCTGAGG CCTGAGTGAG TGTTTGGCCG AGGCCTGCAT GTCCGGCTGA AGGCTGAGTG TCCGGCTGAG 3640 
GCCTGAGCGA GTGTCCAGCC AAGGGCTGAG TGTCCAGCAC ACCTGCCGTC TTCACTTCCC CACAGGCIGG 3710 
CGCTCGGCTC CACCCCAGGG CCAGCTTTTC CTCACCAGGA GCCCGGCITC CACTCCCCAC AXAGGAATAG 3780 
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Fig. 10 



ACTTGAGCCC AAGAGTTCAA GGCTACGGTG AGCCATGATT GCAACACCAC ACGCCAGCCT TGGTGACAGA -11204 
ATGAGACCCT. GTCTCAAAAA AAAAAAAAAA AATTGAAATA ATATAAAGCA TCTTCTCTGG CCACAGTGGA -11134 
ACAAAACCAG AAATCAACAA CAAGAGGAAT TTTGAAAACT ATACAAACAC ATGAAAATTA AACAATATAC -11064 
TTCTGAATGA CCAGTGAGTC AATGAAGAAA *TTAAAAAGGA AATTGAAAAA TTTATTTAAG CAAATGATAA -10994 
CGGAAACATA ACCTCTCAAA ACCCACGGTA TACAGCAAAA GCAGTGCTAA GAAGGAAGTT TATAGCTATA -10924 
AGCAGCTACA TCAAAAAAGT AGAAAAGCCA GGCGCAGTGG CTCATGCCTG TAATCCCAGC ACTTTGGGAG -10854 
GCCAAGGCGG GCAGATCGCC TGAGGTCAGG AGTTCGAGAC CAGCCTGACC AACACAGAGA AACCTTGTCG -10784 
CTACTAAAAA TACAAAATTA GCTGGGCATG GTGGCACATG CCTGTAATCC CAGCTACTCG GGAGGCTGAG -10714 
GCAGGATAAC CGCTTGAACC CAGGAGGTGG AGGTTGCGGT GAGCCGGGAT TGCGCCATTG GACTCCAGCC -10644 
TGGGTAACAA GAGTGAAACC CTGTCTCAAG AAAAAAAAAA AAGTAGAAAA ACTTAAAAAT ACAACCTAAT -10574 
GATGCACCTT AAAGAACTAG AAAAGCAAGA GCAAACTAAA CCTAAAATTG GTAAAAGAAA AGAAATAATA -10504 
AAGATCAGAG CAGAAATAAA TGAAACTGAA AGATAACAAT ACAAAAGATC AACAAAATTA AAAGTTGGTT -10434 
TTTTGAAAAG ATAAACAAAA TTGACAAACC TTTGCCCAGA CTAAGAAAAA AGGAAAGAAG ACCTAAATAA -10364 
ATAAAGTCAG AGATGAAAAA AGAGACATTA CAACTGATAC CACAGAAATT CAAAGGATCA CTAGAGGCTA -10294 
CTATGAGCAA CTGTACACTA ATAAATTGAA AAACCTAGAA AAAATAGATA AATTCCTAGA TGCATACAAC -10224 
CTACCAAGAT TGAACCATGA AGAAATCCAA AGCCCAAACA GACCAATAAC AATAATGGGA TTAAAGCCAT -10154 
AATAAAAAGT CTCCTAGCAA AGAGAAGCCC AGGACCCAAT GGCTTCCCTG CTGGATTTTA CCAATCATTT -10084 
AAAGAAGAAT GAATTCCAAT CCTACTCAAA CTATTCTGAA AAATAGAGGA AAGAATACTT CCAAACTCAT -10014 
TCTACATGGC CAGTATTACC CTGATTCCAA AACCAGACAA AAACACATCA AAAACAAACA AACAAAAAAA -9944 
CAGAAAGAAA GAAAACTACA GGCCAATATC CCTGATGAAT ACTGATACAA AAATCCTCAA CAAAACACTA -9874 
GCAAACCAAA TTAAACAACA CCTTCGAAAG ATCATTCATT GTGATCAAGT GGGATTTATT CCAGGGATGG -9804 
AAGGATGGTT CAACATATGC AAATCAATCA ATGTGATACA TCATCCCAAC AAAATGAAGT ACAAAAACTA -9734 
TATGATTATT TCACTTTATG CAGAAAAAGC ATTTGATAAA ATTCTGCACC CTTCATGATA AAAACCCTCA -9664 
AAAAACCAGG TATACAAGAA ACATACAGGC CAGGCACAGT GGCTCACACC TGCGATCCCA GCACTCTGGG -9594 
AGGCCAAGGT GGGATGATTG CTTGGGCCCA GGAGTTTGAG ACTAGCCTGG GCAACAAAAT GAGACCTGGT -9524 
CTACAAAAAA CTTTTTTAAA AAATTAGCCA GGCATGATGG CATATGCCTG TAGTCCCAGC TAGTCTGGAG -9454 
GCTGAGGTGG GAGAATCACT TAAGCCTAGG AGGTCGAGGC TGCAGTGAGC CATGAACATG TCACTGTACT -9384 
CCAGCCTAGA CAACAGAACA AGACCCCACT GAATAAGAAG AAGGAGAAGG AGAAGGGAGA AGGGAGGGAG -9314 
AAGGGAGGAG GAGGAGAAGG AGGAGGTGGA GGAGAAGTGG AAGGGGAAGG GGAAGGGAAA GAGGAAGAAG -9244 
AAGAAACATA TTTCAACATA ATAAAAGCCC TATATGACAG ACCGAGGTAG TATTATGAGG AAAAACTGAA -9174 
AGCCTTTCCT CTAAGATCTG GAAAATGACA AGGGCCCACT TTCACCACTG TGATTCAACA TAGTACTAGA -9104 
AGTCCTAGCT AGAGCAATCA GATAAGAGAA AGAAATAAAA GGCATCCAAA CTGGAAAGGA AGAAGTCAAA -9034 
TTATCCTGTT TGCAGATGAT ATGATCTTAT ATCTGGAAAA GACTTAAGAC ACCACTAAAA AACTATTAGA -8964 
GCTGAAATTT GGTACAGCAG GATACAAAAT CAATGTACAA AAATCAGTAG TATTTCTATA TTCCAACAGC -8894 
AAACAATCTG AAAAAGAAAC CAAAAAAGCA GCTACAAATA AAATTAAACA GCTAGGAATT AACCAAAGAA -8824 
GTGAAAGATC TCTACAATGA AAACTATAAA ATGTTGATAA AAGAAATTGA AGAGGGCACA AAAAAAGAAA -8754 
AGATATTCCA TGTTCATAGA TTGGAAGAAT AAATACTGTT AAAATGTCCA TACTACCCAA AGCAATTTAC -8684 
AAATTCAATG CAATCCCTAT TAAAATACTA ATGACGTTCT TCACAGAAAT AGAAGAAACA ATTCTAAGAT -8614 
TTGTACAGAA CCACAAAAGA CCCAGAATAG CCAAAGCTAT CCTGACCAAA AAGAACAAAA CTGGAAGCAT -8544 
CACATTACCT GACTTCAAAT TATACTACAA AGCTATAGTA ACCCAAACTA CATGGTACTG GCATAAAAAC -8474 
AGATGAGACA TGGACCAGAG GAACAGAATA GAGAATCCAG AAACAAATCC ATGCATCTAC AGTGAACTCA -8404 
TTTTTGACAA AGGTGCCAAG AACATACTTT GGGGAAAAGA TAATCTCTTC AATAAATGGT GCTGGAGGAA -8334 
CTGGATATCC ATATGCAAAA TAACAATACT AGAACTCTGT CTCTCACCAT ATACAAAAGC AAATCAAAAT -8264 
GGATGAAAGG CTTAAATCTA AAACCTCAAA CTTTGCAACT ACTAAAAGAA AACACCGGAG AAACTCTCCA -8194 
GGACATTGGA GTGGGCAAAG ACTTCTTGAG TAATTCCCTG CAGGCACAGG CAACCAAAGC AAAAACAGAC -8124 
AAATGGGATC ATATCAAGTT AAAAAGCTTC TGCCCAGCAA AGGAAACAAT CAACAAAGAG AAGAGACAAC -8054 
CCACAGAATG GGAGAATATA TTTGCAAACT ATTCATCTAA CAAGGAATTA ATAACCAGTA TATATAAGGA -7984 
GCTCAAACTA CTCTATAAGA AAAACACCTA ATAAGCTGAT TTTCAAAAAT AAGCAAAAGA TCTGGGTAGA -7914 
CATTTCTCAA AATAAGTCAT ACAAATGGCA AACAGGCATC TGAAAATGTG CTCAACACCA CTGATCATCA -7844 
GAGAAATGCA AATCAAAACT ACTATGAGAG ATCATCTCAT CCCAGTTAAA ATGGCTTTTA TTCAAAAGAC -7774 
AGGCAATAAC AAATGCCAGT GAGGATGTGG ATAAAAGGAA ACCCTTGGAC ACTGTTGGTG GGAATGGAAA -7704 
TTGCTACCAC TATGGAGAAC AGTTTGAAAG TTCCTCAAAA AACTAAAAAT AAAGCTACCA TACAGCAATC -7634 
CCATTGCTAG GTATATACTC CAAAAAAGGG AATCAGTGTA TCAACAAGCT ATCTCCACTC CCACATTTAC -7564 
TGCAGCACTG TTCATAGCAG CCAAGGTTTG GAAGCAACCT CAGTGTCCAT CAACAGACGA ATGGAAAAAG -74 94 
AAAATGTGGT GCACATACAC AATGGAGTAC TACGCAGCCA TAAAAAAGAA TGAGATCCTG TCAGTTGCAA -7424 
CAGCATGGGG GGCACTGGTC AGTATGTTAA GTGAAATAAG CCAGGCACAG AAAGACAAAC TTTTCATGTT -7354 
CTCCCTTACT TGTGGGAGCA AAAATTAAAA CAATTGAGAT AGAAATAGAG GAGAATGGTG GTTCTAGAGG -7284 
GGTGGGGGAC AGGGTGACTA GAGTCAACAA TAATTTATTG TATGTTTTAA AATAACTAAA AGAGTATAAT -7214 
TGGGTTGTTT GTAACACAAA GAAAGGATAA ATGCTTGAAG GTGACAGATA CCCCATTTAC CCTGATGTGA -7144 
TTATTACACA TTGTATGCCT GTATCAAAAT ATCTCATGTA TGCTATAGAT ATAAACCCTA CTATATTAAA -7074 
AATTAAAATT TTAATGGCCA GGCACGGTGG CTCATGTCCG TAATCCCAGC ACTTTGGGAG GCCGAGGCGG -7004 
GTGGATCACC TGAGGTCAGG AGTTTGAAAC CAGTCTGGCC ACCATGATGA AACCCTGTCT CTACTAAAGA -6934 
TACAAAAATT AGCCAGGCGT GGTGGCACAT ACCTGTAGTC CCAACTACTC AGGAGGCTGA GACAGGAGAA -6864 
TTGCTTGAAC CTGGGAGGCG GAGGTTGCAG TGAGCCGAGA TCATGCCACT GCACTGCAGC CTGGGTGACA -6794 
GAGCAAGACT CCATCTCAAA ACAAAAACAA AAAAAAGAAG ATTAAAATTG TAATTTTTAT GTACCGTATA -6724 
AATATATACT CTACTATATT AGAAGTTAAA AATTAAAACA ATTATAAAAG GTAATTAACC ACTTAATCTA -6654 
AAATAAGAAC AATGTATGTG GGGTTTCTAG CTTCTGAAGA AGTAAAAGTT ATGGCCACGA TGGCAGAAAT -6584 
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GTGAGGAGGG AACAGTGGAA GTTACTGTTG TTAGACGCTC ATACTCTCTG ™GTGAOT AATTTTAACC -6514 
AAAGACAGGC TGGGAGAAGT TAAAGAGGCA TTCTATAAGC CCTAAAACAA CTGCTAATAA TGGTGAAAGG 6444 
TAATCTCTAT TAATTACCAA TAATTACAGA TATCTCTAAA ATCGAGCTGC AGAATTGGCA CGTCTGATCA 6374 
rurrmrcTCl TCATTCACGG TGCTTTTTTT CTTGTGTGCT TGGAGATTTT CGATTGTGTG TTCGTGTTTG 6304 

ISSmga SSgIIac gaaaaatggt ggtgatttcc ^cagaagaa ttagagtacc -623 

• TGGCAGGAAG CAGGTGGCTC TGTGGACCTG AGCCACTTCA ATCTTCAAGG GTCTCTGGCC AAGACCCAGG 6164 
TGCAAGGCAG AGGCCTGATG ACCCGAGGAC AGGAAAGCTC GGATGGGAAG GGGCGATGAG AAGCCTGCCT 6094 
SSg CAGCGCATGA AGTGCCCTTA TTTACGCTTT GCAAAGATTG CTCTGGATAC CATCTGGAAA -602 
AGGCGGCCAG CGGGAATGCA AGGAGTCAGA AGCCTCCTGC TCAAACCCAG GCCAGCAGCT ATGGCGCCCA 5954 
CCCGGGCGTG TGCCAGAGGG AGAGGAGTCA AGGCACCTCG AAGTATGGCT TAAATCTTTT TTTCACCTGA -588 
AGCAGTGACC AAGGTGTATT CTGAGGGAAG CTTGAGTTAG GTGCCTTCTT TAAAACAGAA AGTCATGGAA 5814 
GCACCCTTCT CAAGGGAAAA CCAGACGCCC GCTCTGCGGT CATTTACCTC TTTCCTCTCT CCCTCTCTTG 5744 
CCCTCGCGGT TTCTGATCGG GACAGAGTGA CCCCCGTGGA GCTTCTCCGA GCCCGTGCTG AGGACCCTCT 5674 
SSaAGGGC TcScAGACC CCCGCCCTGG AGAGAGGAGT CTGAGCCTGG CTTAATAACA AACTGGGATG -5604 
JgG^GgIgG CgScAGCGA CGGCGGGATT CAAAGACTTA ATTCCATGAG TAAATTCAAC CTTTCCACAT -5534 
CCGAATGGAT TTGGATTTTA TCTTAATATT TTCTTAAATT TCATCAAATA ACATTCAGGA CTGCAGAAAT 

cSSS aSSaggaa ctgagctatg tttgccaagg tccaaggact taataaccat gttcagaggg 

ATTTTTCGCC CTAAGTACTT TTTATTGGTT TTCATAAGGT GGCTTAGGGT GCAAGGGAAA GTACACGAGG 
.SS SSS TATGAGCACG GCAGGGCCAC CGGGGAGAGA GTCCCCGGCC TGGGAGGCTG - 2 

ACAGCAGGAC CACTGACCGT CCTCCCTGGG AGGTGCCACA TTGGGCAACG CGAAGGCGGC CACGCTGCGT 5184 

GTGACTCAGG ACCCCATACC GGCTTCCTGG GCCCACCCAC ACTAACCCAG GAAGTCACGG AGCTCTGAAC 5114 

CCGTGGAAAC GAACATGACC CTTGCCTGCC TGCTTCCCTG GGTGGGTCAA GGGTAATGAA GTGGTGTGCA 5044 

GGAAATGGCC ATGTAAATTA CACGACTCTG CTGATGGGGA CCGTTCCTTC CATCATTATT ^™ACC 4974 

CCCAAGGACT GAATGATTCC AGCAACTTCT TCGGGTGTGA CAAGCCATGA CAAAACTCAG TACAAACACC 4904 

ACTCTTTTAC TAGGCCCACA GAGCACGGSC CACACCCCTG ATATATTAAG AGTCCAGGAG AGATGAGGCT 4834 



-5464 
-5394 
-5324 



ACTCTTTTAC TAGGCCCAUA bAbtrt^^^ ^wv-www* » " .^np.r TnrarrrTGG -4*764 

GCTTTCAGCC ACCAGGCTGG GGTGACAACA GCGGCTGAAC AGTCTGTTCC TCTAGACTAG TAGACCCTGG 4764 
nrcrACTCC CCCAGATTCT AGGGCCTGGT TGCTGCTTCC CGAGGGCGCC ATCTGCCCTG GAGACTCAGC *w 
SS AcSS cScCTGTC TCCACACCCT CCGCCTCCAG GCCTCAGCTT CTCCAGCAGC - 
TTCCTAAACC CTGGGTGGGC CGTGTTCCAG CGCTACTGTC TCACCTGTCC CACTGTGTCT TGTCTCAGCG M 

IcgScg cacggttcct cctcacatgg ggtgtctgtc tccttcccca acactcacat gcgttgaagg - 8 

GAGGAGATTC TGCGCCTCCC AGACTGGCTC CTCTGAGCCT GAACCTGGCT CGTGGCCCCC GATGCAGGTT 4414 

CCTGGCGTCC GGCTGCACGC TGACCTCCAT TTCCAGGCGC TCCCCGTCTC CTGTCATCTG CCGGGGCCTG 4344 

CCGGTGTGTT CTTCTGTTTC TGTGCTCCTT TCCACGTCCA GCTGCGTGTG TCTCTGCCCG CTAGGGTCTC « 4. 

GGGGTTTTTA TAGGCATAGG ACGGGGGCGT GGTGGGCCAG GGCGCTCTTG GGAAATGCAA CATTTGGGTG 4£ 

TGAAAGTAGG AGTGCCTGTC CTCACCTAGG TCCACGGGCA CAGGCCTGGG GATGGAGCCC ^CCAGGGA 4134 

CCCGCCCTTC TCTGCCCAGC ACTTTCCTGC CCCCCTCCCT CTGGAACACA ^GCAGT TTCCACA^ 406 
ACTAAGCATC CTCTTCCCAA AAGACCCAGC ATTGGCACCC CTGGACATTT GCCCCACAGC CCTGGGAATT 

Icfeh CTA CGCACATCAT GTACACACTC CCGTCCRCGA CCGACCCCCG CTGTTTTATT TTAATAGCTA -3924 
CAAAGCAGGG AAATCCCTGC TAAAATGTCC TTTAACAAAC TGGTTAAACA AACGGGTCCA TCCGCACGGT 3854 
GGACAGTTCC TCACAGTGAA GAGGAACATG CCGTTTATAA AGCCTGCAGG CATCTCAAGG GAATTACGCT 3784 
GAGTCAAAAC TGCCACCTCC ATGGGATACG TACGCAACAT GCTCAAAAAG AAAGAATTTC ^CCCMGGC _3 



AGGGGAGTGG TTAGGGGGGT TAAGGACGGT GGGGGCGGCA GCTGGGGGCT ACTGCACGCA CCTTTTACTA ^ 

3504 
3434 
3364 

= =£K GCC= ™-CA GXCAGTCTGA ~^ -3294 



Sgg^g a^t^g ctcag^a^ g^agactaac CATAGGGGAG TGGGGATGGG 
££S SSSSa tc?ttgccat gcccgagtgt cctgggcagg ataatgctct agagatgccc - o 

ACGTCCTGAT TCCCCCAAAC CTGTGGACAG AACCCGCCCG GCCCCAGGGC CTTTGCAGGT GTGATCTCCG 3434 
TGAGGACCCT GAGGTCTGGG ATCCTTCGGG • ACTACCTGCA GGCC06MU GTAATCCAGG GGTTCTGGGA 



AGAGGCGGGC AGGAGGGTUA UhbObwiu^ u^iww^v. rwnrrrrrr -3224 

GGAGGGAGGG CCTCGAGCCC AGGCCTGCAA GCGCCTCCAG AAGCTGGAAA AAGCGGGGAA GGGACCCTCC 3224 

ACGGAGCCTG CAGCAGGAAG GCACGGCTGG CCCTTAGCCC ACCAGGGCCC ATCGTGGACC TCCGGCCTCC 3154 

GTGCCATAGG AGGGCACTCG CGCTGCCCTT CTAGCATGAA GTGTGTGGGG A™CAGAA GCAACAGGAA 3084 

ACCCATGCAC TGTGAATCTA GGATTATTTC AAAACAAAGG TTTACAGAAA CATCCAAGGA CAGGGCTGAA 3014 

GTGCCTCCGG GCAAGGGCAG GGCAGGCACG AGTGATTTTA TTTAGCTATT "ATTTTATT TACTTACTTT 2944 

CTGAGACAGA GTTATGCTCT TGTTGCCCAG GCTGGAGTGC AGCGGCATGA TCTTGGCTCA CTGCAACCTC 2874 

CGTCTCCTGG GTTCAAGCAA TTCTCGTGCC TCAGCCTCCC AAGTAGCTGG GATTTCAGGC ^CACCACC 2804 

ACACCCGGCT AATTTTGTAT TTTTAGTAGA GATGGGCTTT CACCATGTTG GTCAAGCTGA TCTCAAAATC 2734 

CTGACCTCAG GTGATCCGCC CACCTCAGCC TCCCAAAGTG CTGGGATTAC AGGCATGAGC CACTGCACCT 2664 

GGCCTATTTA ACCATTTTAA AACTTCCCTG GGCTCAAGTC ACACCCACTG GTAAGGAGTT CA^AGrTC 2594 

AATTTCCCCT TTACTCAGGA GTTACCCTCC TTTGATATTT TCTGTAATTC JTCGTAGACT GGGGATACAC 2524 

CGTCTCTTGA CATATTCACA GTTTCTGTGA CCACCTGTTA TCCCATGGGA CCCACTGCAG GGGCAGCTGG 2454 

GAGGCTGCAG GCTTCAGGTC CCAGTGGGGT TGCCATCTGC CAGTAGAAAC CTGATGTAGA JTCAGGGCGC 2384 

AAGTGTGGAC ACTGTCCTGA ATCTCAATGT CTCAGTGTGT GCTGAAACAT GTAGAAATTA AAGTCCATCC 2314 

CTCCTACTCT ACTGGGATTG AGCCCCTTCC CTATCCCCCC CCAGGGGCAG AGGAGTTCCT CTCACTCCTG 2244 

TGGAGGAAGG AATGATACTT TGTTATTTTT CACTGCTGGT ACTGAATCCA CTGTTTCATT TGTTGGTTTG 2174 

TTTGTTTTGT TTTGAGAGGC GGTTTCACTC TTGTTGCTCA GGCTGGAGGG AGTGCAATGG CGCGATCTTG 2104 

GCTTACTGCA GCCTCTGCCT CCCAGGTTCA AGTGATTCTC CTGCTTCCGC CTCCCATTTG GCTGGGATTA 2034 

CAGGCACCCG CCACCATGCC CAGCTAATTT TTTGTATTTT TAGTAGAGAC GGGGGTGGGT GGGGTTCACC 1964 
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ATGTTGGCCA GGCTGGTCTC GAACTTCTGA CCTCAGATGA TCCACCTGCC TCTGCCTCCT AAAGTGCTGG -1894 
GATTACAGGT GTGAGCCACC ATGCCCAGCT CAGAATTTAC TCTGTTTAGA AACATCTGGG TCTGAGGTAG -1824 

CAAT-Box 

GAAGCTCACC CCACTCAAGT GTTGTGGTGT TTTA flGCCAA TE ATAGAATT TTTTTATTGT TGTTAGAACA -1754 

CTCTTGATGT TTTACACTGT GATGACTAAG ACATCATCAG CTTTTCAAAG ACACACTAAC TGCACCCATA -1684 

ATACTGGGGT GTCTTCTGGG TATCAGCAAT CTTGATTGAA TGCCGGGAGG CGTTTCCTCG CCATGCACAT -1614 

GGTGTTAATT ACTCCAGCAT AATCTTCTGC TTCCATTTCT TCTCTTCCCT CTTTTAAAAT TGTGTTTTCT -1544 

ATGTTGGCTT CTCTGCAGAG AACCAGTGTA AGCTACAACT TAACTTTTGT TGGAACAAAT TTTCCAA^Cc] -1474 
Spl 

|GCCCj CTTTGC CCTAGTGGCA GAGACAATTC ACAAACACAG CCCTTTAAAA AGGCTTAGGG ATCACTAAGG -1404 

GGATTTCTAG AAGAGCGACC TGTAATCCTA AGTATTTACA AGACGAGGCT AACCTCCAGC GAGCGTGACA -1334 

GCCCAGGGAG GGTGCGAGGC CTGTTCAAAT . GCTAGCTCCA TAAATAAAGC AATTTCCTCC GGCAGTTTCT -1264 

GAAAGTAGGA AAGGTTACAT TTAAGGTTGC GTTTGTTAGC ATTTCAGTGT TTGCCGACCT CAGCTACAGC -1194 

ATCCCTGCAA GGCCTCGGGA GACCCAGAAG TTTCTCGCCC CCTTAGATCC AAACTTGAGC AACCCGGAGT -1124 

CTGGATTCCT GGGAAGTCCT CAGCTGTCCT GCGGTTGTGC CGGGGCCCCA GGTCTGGAGG. GGACCAGTGG -1054 

CCGTGTGGCT TCTACTGCTG GGCTGGAAGT CGGGCCTCCT AGCTCTGCAG TCCGAGGCTT GGAGCCAGGT -984 

GCCTGGACCC CGAGGCTGCC CTCCACCCTG TGCGGGCGGG ATGTGACCAG ATGTTGGCCT CATCTGCCAG -914 

ACAGAGTGCC GGGGCCCAGG GTCAAGGCCG TTGTGGCTGG TGTGAGGCGC CCGGTGCGCG GCCAGCAGGA -844 
CCAC-Box Spl 

GCGCCTGGCT CCATTl jCCCA CCCf TTTCTCG ACGGGAc jcGC CCCfc GTGGGT GATTAACAGA TTTGGGGTGG -774 

TTTGCTCATG GTGGGGACCC CTCGCCGCCT GAGAACCTGC AAAGAGAAAT GACGGGCCTG TGTCAAGGAG -704 

CCCAAGTCGC GGGGAAGTGT TGCAGGGAGG CACTCCGGGA GGTCCCGCGT GCCCGTCCAG GGAGCAATGC -634 
AP-2 

GTCCTCGGGT TC qTCCCCAG CCCfc GTCTAC GCGCCTCCGT CCTCCCCTTC ACGTCCGGCA TTCGTGGTGC -564 

CCGGAGCCCG ACGCCCCGCG TCCGGACCTG GAGGCAGCCC TGGGTCTCCG GATCAGGCCA GCGGCCAAAG -4 94 

GGTCGCCGCA CGCACCTGTT CCCAGGGCCT CCACATCATG GCCCCTCCCT CGGGTTACCC CACAGCCTAG -424 

SpJ 

GCCGATTCGA CCTCTCTCCG CTGGGGCCCT CGCTGGCGTC CCTGCACCCT GGGAGCGCGA GCGGCfcCGCG 

Spl ^ 



354 



[GGCCjG GGAAG CGCGGCCCAG ACCCCCGGGT |CCGCCCfc GAG CAGCTGCGCT GTCGGGGCCA GGCCGGGCTC -284 

c-Mvc 

CCAGTGGATT CGCGGGCACA GACGCCCAGG ACCGCGCTCC C fcACGT GfcCG GAGGGACTGG GGACCCGGGC -214 

Spl 

ACCCGTCCTG CCCCTTCACC TTCCAGCTCC GCCTCCTCCG CGCGGACdCC GCCCfcGTCCC GACCCCTCCC -144 

SpI 

GGGTCCCCGG CCCAGCCCCC TCCGGGCCCT CCCAGCCC CT CCCCTTCCTT TCCGCGGCCjC CGCCClrCTCC -74 

c-Afvc 

TCGCGGCGCG AGTTTCAGGC AGCGCTGCGT CCTGCTGCC fc ACGTGfc GAAG CCCTGGCCCC GGCCACCCCC -4 

GCGATG 3 
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SEQUENZPROTOKOLL 

<110> Bayer AG 

<120> Regulatorische DNA-Sequenzen aus der 5I-Region vom Gen 
der humanen katalytischen Telomerase-Untereinheit und 
der en diagnostische und therapeutische Verwendung 

<130> LeA32805-Ausland 

<140> 
<141> 

<160> 20 

<170> Patentln Vers. 2.0 

<210> 1 
<211> 5126 
<212> DNA 

<213> Homo sapiens 
<400> 1 

gagctctgaa ccgtggaaac gaacatgacc cttgcctgcc tgcttccctg ggtgggtcaa 60 
gggtaatgaa gtggtgtgca ggaaatggcc atgtaaatta cacgactctg ctgatgggga 120 
ccgttccttc catcattatt catcttcacc cccaaggact gaatgattcc agcaacttct 180 
tcgggtgtga caagccatga caaaactcag tacaaacacc actcttttac taggcccaca 24 0 
gagcacgggc cacacccctg atatattaag agtccaggag agatgaggct gctttcagcc 300 
accaggctgg ggtgacaaca gcggctgaac agtctgttcc tctagactag tagaccctgg 360 
caggcactcc cccaaatcct agggcctggt tgctgcctcc cgagggcgcc atctgccctg 420 
gagactcagc ctggggtgcc acactgaggc cagccctgtc tccacaccct ccgcctccag 480 
gcctcagctt ctccagcagc ttcctaaacc ctgggtgggc cgtgttccag cgctactgtc 540 
tcacctgtcc cactgtgtct tgtctcagcg acgtagctcg cacggttcct cctcacatgg 600 
ggtgtctgtc tccttcccca acactcacat gcgttgaagg gaggagattc tgcgcctccc 660 
agaccggctc ctctgagcct gaacctggct cgtggccccc gatgcaggtt cctggcgtcc 720 
ggctgcacgc tgacctccat ttccaggcgc tccccgtctc ctgtcatctg ccggggcctg 780 
ccggtgtgtt cttctgtttc tgtgctcctt tccacgtcca gctgcgtgtg tctctgcccg 840 
ctagggtctc ggggttttta taggcatagg acgggggcgt ggtgggccag ggcgctcttg 900 
ggaaatgcaa catttgggtg tgaaagtagg agtgcctgtc ctcacctagg tccacgggca 960 
caggcctggg gatggagccc ccgccaggga cccgcccttc tctgcccagc actttcctgc 1020 
ccccctccct ctggaacaca gagtggcagt ttccacaagc actaagcatc ctcttcccaa 1080 
aagacccagc attggcaccc ctggacattt gccccacagc cctgggaatt cacgtgacta 1140 
cgcacatcat gtacacactc ccgtccacga ccgacccccg ctgttttatt ttaatagcta 1200 
caaagcaggg aaatccctgc taaaatgtcc tttaacaaac tggtcaaaca aacgggtcca 1260 
tccgcacggt ggacagttcc tcacagtgaa gaggaacatg ccgtttataa agcctgcagg 1320 
catctcaagg gaattacgct gagtcaaaac cgccacctcc atgggatacg tacgcaacat 13 80 
gctcaaaaag aaagaatttc accccatggc aggggagtgg ttaggggggt taaggacggt 1440 
gggggcggca gctgggggct actgcacgca ccttttacta aagccagttt cctggttctg 1500 
atggtattgg cccagttatg ggagaccaac cataggggag tggggatggg ggaacccgga 1560 
ggctgtgcca tctttgccat gcccgagtgt cctgggcagg ataatgctct agagatgccc 1620 
acgtcctgat tcccccaaac ctgtggacag aacccgcccg gccccagggc ctttgcaggt 1680 
gtgatctccg tgaggaccct gaggtctggg atccttcggg actacctgca ggcccgaaaa 1740 
gtaatccagg ggttctggga agaggcgggc aggagggtca gaggggggca gcctcaggac 1800 
gatggaggca gccagtctga ggctgaaaag ggagggaggg cctcgagccc aggcctgcaa 1860 
gcgcctccag aagctggaaa aagcggggaa gggaccctcc acggagcctg cagcaggaag 1920 
gcacggctgg cccttagccc accagggccc atcgtggacc tccggcctcc gtgccatagg 1980 
agggcactcg cgctgccctt ctagcatgaa gcgtgtgggg atttgcagaa gcaacaggaa 2040 
acccatgcac tgtgaatcta ggactatttc aaaacaaagg tttacagaaa catccaagga 2100 
cagggctgaa gtgcccccgg gcaagggcag ggcaggcacg agtgatttta ttcagctatt 2160 
tcattttatt tacttacttt ccgagacaga gttatgctct tgttgcccag gctggagtgc 2220 
agcggcatga tcttggctca ctgcaacccc cgtctcccgg gttcaagcaa ttctcgtgcc 2280 
tcagcctccc aagtagctgg gatttcaggc gtgcaccacc acacccggcc aattttgtat 2340 
ctttagtaga gatgggcttt caccatgtcg gtcaagctga tctcaaaatc ctgacctcag 2400 
gtgatccgcc cacctcagcc tcccaaagcg ccgggattac aggcatgagc cactgcacct 24 60 
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ggcctattta accactttaa aacttccctg 
catggagttc aatttcccct ttactcagga 
ttcgtagact ggggatacac cgtctcttga 
tcccatggga cccactgcag gggcagctgg 
tgccatctgc cagtagaaac ctgatgtaga 
atctcaatgt ctcagtgtgc gctgaaacat 
actgggattg agccccttcc ccatcccccc 
tggaggaagg aatgatactt tgttattttt 
tgttggtttg tttgttttgt tttgagaggc 
agtgcaatgg cgcgatcttg gcttactgca 
ctgcttccgc ctcccatttg gctgggatta 
tttgtatttt tagtagagac gggggtgggt 
gaacttctga cctcagacga tccacctgcc 
gtgagccacc atgcccagcc cagaatttac 
gaagctcacc ccactcaagt gttgtggtgt 
tgttagaaca ctcttgatgt tttacactgt 
acacactaac tgcacccata atactggggt 
tgccgggagg cgtttcctcg ccatgcacat 
ttccatttct tctctcccct cttttaaaat 
aaccagtgta agctacaact taacctttgt 
cctagtggca gagacaattc acaaacacag 
ggatttctag aagagcgacc tgtaatccta 
gagcgtgaca gcccagggag ggtgcgaggc 
aatttcctcc ggcagtttct gaaagtagga 
atttcagtgt ttgccgacct cagctacagc 
tttctcgccc ccttagatcc aaacttgagc 
cagctgtcct gcggttgtgc cggggcccca 
tctactgctg ggctggaagt cgggcctcct 
gcctggaccc cgaggctgcc ctccaccctg 
catctgccag acagagtgcc ggggcccagg 
ccggtgcgcg gccagcagga gcgcctggct 
cccggtgggt gattaacaga tctggggtgg 
gagaacctgc aaagagaaac gacgggcctg 
tgcagggagg caccccggga ggtcccgcgt 
tcgtccccag ccgcgtctac gcgcctccgt 
ccggagcccg acgccccgcg tccggacctg 
gcggccaaag ggtcgccgca cgcacctgtt 
cgggttaccc cacagcctag gccgattcga 
cctgcaccct gggagcgcga gcggcgcgcg 
ccgcccggag cagctgcgct gtcggggcca 
gacgcccagg accgcgctcc ccacgtggcg 
ccccttcacc ttccagctcc gcctcctccg 
gggtccccgg cccagccccc tccgggccct 
cgccctctcc tcgcggcgcg agtttcaggc 
ccccggcccc ggccaccccc gcgatg 

<210> 2 
<211> 4042 
<212> DNA 

<213> Homo sapiens 
<400> 2 

gtttcaggca gcgctgcgtc ctgctgcgca 
cgatgccgcg cgctccccgc tgccgagccg 
aggtgctgcc gctggccacg ttcgtgcggc 
agcgcgggga cccggcggct ttccgcgcgc 
gggacgcacg gccgcccccc gccgccccct 
tggcggcccg agtgctgcag aggctgtgcg 
gcttcgcgcc gctggacggg gcccgcgggg 
gcagctacct gcccaacacg gtgaccgacg 
tgctgcgccg cgtgggcgac gacgtgctgg 
tgctggtggc tcccagctgc gcctaccagg 
ctgccactca ggcccggccc ccgccacacg 
aacgggcccg gaaccatagc gtcagggagg 
gtgcgaggag gcgcgggggc agtgccagcc 



ggctcaagtc acacccactg gtaaggagtt 2520 
gttaccctcc tttgatattt tctgtaattc 2580 
catattcaca gtttctgtga ccacctgtta 264 0 
gaggctgcag gcttcaggtc ccagtggggt 2700 
atcagggcgc aagtgtggac actgtcctga 2760 
gtagaaatta aagtccatcc. ctcctactct 2820 
ccaggggcag aggagttcct ctcactcctg 2880 
cactgctggt actgaatcca ctgtttcatt 2940 
ggtttcactc ttgttgctca ggctggaggg 3000 
gcctctgcct cccaggttca agtgattctc 3060 
caggcacccg ccaccatgcc cagctaattt 3120 
ggggttcacc atgttggcca ggctggtctc 3180 
tctgcctcct aaagtgctgg gattacaggt 324 0 
tccgtttaga aacacctggg tctgaggtag 3300 
tttaagccaa tgatagaatt tttttattgt 3360 
gatgactaag acatcatcag cttttcaaag 3420 
gtcttctggg tatcagcaat cttcattgaa 3480 
ggtgttaatt actccagcat aatcttctgc 3540 
tgtgttttct atgttggctt ctctgcagag. 3600 
tggaacaaat tttccaaacc gcccctttgc 3660 
ccctttaaaa aggcttaggg atcactaagg 372 0 
agtattcaca agacgaggcc aacctccagc 3780 
ctgttcaaat gctagctcca taaataaagc 3 840 
aaggttacac ttaaggttgc gtttgttagc 3 900 
atccctgcaa ggcctcggga gacccagaag 3 960 
aacccggagt ctggattcct gggaagtcct 4020 
ggtctggagg ggaccagtgg ccgtgtggct 4080 
agctctgcag tccgaggctt ggagccaggt 414 0 
tgcgggcggg atgtgaccag atgttggcct 4200 
gtcaaggccg ttgtggctgg tgtgaggcgc 4260 
ccatttccca ccctttctcg acgggaccgc 4320 
tttgctcatg gtggggaccc ctcgccgcct 4380 
tgtcaaggag cccaagtcgc ggggaagtgt 4440 
gcccgtccag ggagcaatgc gtcctcgggt 4500 
cctccccttc acgtccggca ttcgtggtgc 4560 
gaggcagccc tgggtctccg gatcaggcca 4620 
cccagggcct ccacatcatg gcccctccct 4680 
cctctctccg ctggggccct cgctggcgtc 4 740 
ggcggggaag cgcggcccag acccccgggc 4 800 
ggccgggctc ccagtggatt cgcgggcaca 4 860 
gagggactgg ggacccgggc acccgtcctg 4 920 
cgcggacccc gccccgtccc gacccctccc 4 980 
cccagcccct ccccttcctt tccgcggccc 5040 
agcgctgcgt cctgctgcgc acgtgggaag 5100 

5126 



cgtgggaagc cctggccccg gccacccccg 60 
tgcgctccct gctgcgcagc cactaccgcg 120 
gcctggggcc ccagggctgg cggccggtgc 180 
tggtggccca gtgcctggcg tgcgtgccct 240 
ccttccgcca ggtgtcctgc ctgaaggagc 3 00 
agcgcggcgc gaagaacgtg ctggccttcg 360 
gcccccccga ggccttcacc accagcgtgc 4 20 
caccgcgggg gagcggggcg tgggggccgc 4 80 
ttcacctgct ggcacgctgc gcgctctttg 540 
tgtgcgggcc gccgctgtac cagctcggcg 600 
ctagcggacc ccgaaggcgt ctgggatgcg 660 
ccggggtccc cctgggcctg ccagccccgg 720 
gaagcctgcc gttgcccaag aggcccaggc 780 
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gtggcgctgc ccctgagccg gagcggacgc 
gcaggacgcg tggaccgagt gaccgtggtt 
aagaagccac ctctttggag ggtgcgctct 
gccgccagca ccacgcgggc cccccatcca 
cttgtccccc ggtgtacgcc gagaccaagc 
agctgcggcc ctccttccta ctcagctctc 
tcgtggagac catctttctg ggttccaggc 
cccgcctgcc ccagcgctac tggcaaatgc 
acgcgcagtg cccctacggg gcgctcctca 
ccccagcagc cggtgtctgt gcccgggaga 
aggaggacac agacccccgt cgcctggtgc 
aggtgcacgg cttcgtgcgg gcctgcctgc 
ccaggcacaa cgaacgccgc ttcctcagga 
atgccaagct ctcgctgcag gagctgacgt 
tgcgcaggag cccaggggtt ggctgtgttc 
tcctggccaa gttcctgcac tggctgatga 
tcttttatgt cacggagacc acgtttcaaa 
tctggagcaa gctgcaaagc attggaatca 
agctgtcgga agcagaggtc aggcagcatc 
gactccgctt catccccaag cctgacgggc 
tgggagccag aacgttccgc agagaaaaga 
cactgttcag cgtgctcaac tacgagcggg 
tgctgggccc ggacgatatc cacagggcct 
aggacccgcc gcctgagctg tactttgtca 
tcccccagga caggctcacg gaggtcatcg 
gcgtgcgtcg gtatgccgcg gtzccagaagg 
agagccacgt ctctaccttg acagacctcc 
tgcaggagac cagcccgctg agggatgccg 
aggccagcag tggcctcttc gacgtcttcc 
tcaggggcaa gtcctacgcc cagtgccagg 
tgctctgcag cctgtgctac ggcgacatgg 
acgggctgct cctgcgtttg gtggatgatt 
cgaaaacctt cctcaggacc ctggtccgag 
tgcggaagac agtggtgaac ttccctgtag 
ttcagatgcc ggcccacggc ctattcccct 
tggaggtgca gagcgactac tccagctatg 
tcaaccgcgg cttcaaggct gggaggaaca 
tgaagtgtca cagcctgttt ctggatttgc 
acatctacaa gatcctcctg ctgcaggcgc 
catttcatca gcaagtttgg aagaacccca 
cctccctctg ctactccatc ctgaaagcca 
gcgccgccgg ccctctgccc tccgaggccg 
tcaagctgac tcgacaccgt gtcacctacg 
agacgcagct gagtcggaag ctcccgggga 
acccggcact gccctcagac ttcaagacca 
aggccgagag cagacaccag cagccctgtc 
ggcggcccac acccaggccc gcaccgctgg 
aggcctgcat gtccggctga aggctgagtg 
aagggctgag tgtccagcac acctgccgtc 
caccccaggg ccagcttctc ctcaccagga 
tccatcccca gattcgccac tgttcacccc 
accatccagg tggagaccct gagaaggacc 
aggtgcgccc tgtacacagg cgaggaccct 
ttggggggag gtgctgtggg agtaaaatac 
aaaaaaaaaa aaaaaaaaaa aa 

<210> 3 
<211> 11276 
<212> DNA 

<213> Homo sapiens 



ccgttgggca ggggtcctgg gcccacccgg 840 
tctgtgtggt gtcacctgcc agacccgccg 900 
ctggcacgcg ccactcccac ccatccgtgg 960 
catcgcggcc accacgtccc tgggacacgc 1020 
acttcctcta ctcctcaggc gacaaggagc 1080 
tgaggcccag cctgactggc gctcggaggc 1140 
cctggatgcc agggactccc cgcaggtcgc 1200 
ggcccctgtt tccggagctg cttgggaacc 1260 
agacgcactg cccgctgcga gctgcggtca 1320 
agccccaggg ctctgtggcg gcccccgagg 1380 
agccgctccg ccagcacagc agcccctggc 144 0 
gccggctggt gcccccaggc ctctggggct 1500 
acaccaagaa gttcatctcc ctggggaagc 1560 
ggaagatgag cgtgcgggac tgcgcttggc 1620 
cggccgcaga gcaccgtctg cgtgaggaga 1680 
gtgtgtacgt cgtcgagctg ctcaggtctt 1740 
agaacaggct ctttttctac cggaagagtg 1800 
gacagcactt gaagagggtg cagctgcggg 1860 
gggaagccag gcccgccctg ctgacgtcca 1920 
tgcggccgat tgtgaacatg gactacgtcg 1980 
gggccgagcg tctcacctcg agggtgaagg 2040 
cgcggcgccc cggcctcctg ggcgcctctg 2100 
ggcgcacctt cgtgctgcgt gtgcgggccc 2160 
aggtggatgt gacgggcgcg cacgacacca 2220 
ccagcatcat caaaccccag aacacgtact 2280 
ccgcccacgg gcacgtccgc aaggccctca 234 0 
agccgtacat gcgacagttc gtggctcacc 2400 
tcgtcatcga gcagagctcc tccctgaatg 2460 
tacgcttcac gtgccaccac gccgtgcgca 2520 
ggatcccgca gggctccatc ctctccacgc 2580 
agaacaagct gtttgcgggg attcggcggg 2640 
tcttgttggt gacacctcac ctcacccacg 2700 
gcgcccctga gtatggctgc gtggtgaact 2760 
aagacgaggc cctgggtggc acggcttttg 2820 
ggtgcggcct gctgctggat acccggaccc 2880 
cccggacctc catcagagcc agtctcacct 294 0 
tgcgccgcaa actctttggg gtcttgcggc 3000 
aggtgaacag cctccagacg gtgtgcacca 3060 
acaggtttca cgcatgtgtg ctgcagctcc 3120 
catttttcct gcgcgtcatc tctgacacgg 3180 
agaacgcagg gatgtcgctg ggggccaagg 324 0 
tgcagcggcc gtgccaccaa gcattcctgc 3300 
tgccactcct ggggtcactc aggacagccc 3360 
cgacgctgac tgccctggag gccgcagcca 3420 
tcctggactg atggccaccc gcccacagcc 3480 
acgccgggct ctacgtccca gggagggagg 3540 
gagtctgagg cctgagtgag cgtttggccg 3600 
tccggctgag gcctgagcga gtgtccagcc 3660 
tccacttccc cacaggctgg cgctcggctc 3720 
gcccggcttc cactccccac ataggaatag 3780 
tcgccctgcc ctcctttgcc ctccaccccc 3840 
ctgggagctc tgggaacctg gagcgaccaa 3 900 
gcacctggat gggggtccct gcgggtcaaa 3960 
tgaacatatg agttcctcag ttttgaaaaa 4020 

4042 



<400> 3 

acccgagccc aagagttcaa ggctacggtg 
c 99t9acaga atgagacccc gtctcaaaaa 
ccttctctgg ccacagtgga acaaaaccag 



agccatgact gcaacaccac acgccagcct 60 
aaaaaaaaaa aattgaaata atataaagca 120 
aaatcaacaa caagaggaat tctgaaaacc 180 
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atacaaacac atgaaaatta aacaatatac 
ttaaaaagga aattgaaaaa tttatttaag 
acccacggta tacagcaaaa gcagtgctaa 
tcaaaaaagt agaaaagcca ggcgcagtgg 
gccaaggcgg gcagatcgcc tgaggtcagg 
aaccttgtcg ctactaaaaa tacaaaatta 
cagctactcg ggaggctgag gcaggataac 
gagccgggat tgcgccactg gaccccagcc 
aaaaaaaaaa . aagtagaaaa acttaaaaat 
aaaagcaaga gcaaactaaa cctaaaattg 
cagaaataaa tgaaactgaa agataacaat 
txttgaaaag ataaacaaaa ttgacaaacc 
acctaaataa ataaagtcag agatgaaaaa 
caaaggatca ctagaggcta ctatgagcaa 
aaaatagaca aattcctaga tgcatacaac 
agcccaaaca gaccaataac aataatggga 
agagaagccc aggacccaat ggcttccctg 
gaattccaat cctactcaaa ctattctgaa 
tctacatggc cagtattacc ctgattccaa 
aacaaaaaaa cagaaagaaa gaaaactaca 
aaatcctcaa caaaacacta gcaaaccaaa 
gtgatcaagt gggatttatt ccagggatgg 
atgtgataca tcatcccaac aaaatgaagt 
cagaaaaagc atttgataaa attctgcacc 
tatacaagaa acatacaggc caggcacagt 
aggccaaggt gggatgattg cttgggccca 
gagacctggt ctacaaaaaa cttttttaaa 
tagtcccagc tagtctggag gctgaggtgg 
tgcagtgagc catgaacatg tcactgtact 
gaataagaag aaggagaagg agaagggaga 
aggaggtgga ggagaagtgg aaggggaagg 
tttcaacaca ataaaagccc tatatgacag 
agcctttcct ctaagatctg gaaaatgaca 
tagtactaga agtcctagct agagcaatca 
ctggaaagga agaagtcaaa tcatcctgtt 
gacttaagac accactaaaa aactattaga 
caatgtacaa aaatcagtag catttctata 
caaaaaagca gctacaaata aaattaaaca 
tctacaatga aaactataaa atgttgataa 
agatattcca tgttcataga ttggaagaat 
agcaatttac aaattcaatg caatccctat 
agaagaaaca actctaagat ttgtacagaa 
cctgaccaaa aagaacaaaa ccggaagcat 
agctatagca acccaaacta catggtactg 
gaacagaata gagaatccag aaacaaatcc 
a 99tgccaag aacatacttc ggggaaaaga 
ctggatatcc atatgcaaaa taacaatacc 
aaatcaaaat ggatgaaagg cttaaatcca 
aacaccggag aaactctcca ggacattgga 
caggcacagg caaccaaagc aaaaacagac 
cgcccagcaa aggaaacaat caacaaagag 
tttgcaaact attcacctaa caaggaatta 
ctctataaga aaaacaccta ataagctgat 
catttctcaa aataagtcat acaaatggca 
ctgatcatca gagaaatgca aatcaaaacc 
atggctttta ttcaaaagac aggcaacaac 
acccttggac actgttggtg ggaatggaaa 
ttcctcaaaa aactaaaaat aaagctacca 
caaaaaaggg aatcagtgta tcaacaagct 
ttcatagcag ccaaggtttg gaagcaacct 
aaaatgtggt gcacatacac aatggagcac 
tcagttgcaa cagcatgggg ggcaccggtc 
aaagacaaac ttttcatgtt ctcccttact 
agaaatagag gagaatggtg gttctagagg 
taatttatcg tatgttttaa aacaactaaa 



ttctgaatga ccagtgagtc aatgaagaaa 240 
caaatgataa cggaaacata acctctcaaa 300 
gaaggaagtt tatagctata agcagctaca 360 
ctcatgcctg taatcccagc actttgggag 420 
agttcgagac cagcctgacc aacacagaga 480 
gctgggcatg gtggcacatg cctgtaatcc 540 
cgcttgaacc caggaggtgg aggttgcggt 600 
tgggtaacaa gagtgaaacc ctgtctcaag 660 
acaacctaat gatgcacctt aaagaactag 720 
gtaaaagaaa agaaataata aagatcagag 780 
acaaaagatc aacaaaatta aaagttggtt 840 
tttgcccaga ccaagaaaaa aggaaagaag SOO 
agagacatta caactgatac cacagaaatt 960 
ctgtacacta ataaattgaa aaacctagaa 1020 
ctaccaagat tgaaccatga agaaatccaa 1080 
ctaaagccat aataaaaagt ctcctagcaa 1140 
ctggatttta ccaatcattt aaagaagaat 1200 
aaatagagga aagaatactc ccaaactcat 1260 
aaccagacaa aaacacatca aaaacaaaca 1320 
ggccaatatc cctgatgaat actgatacaa 1380 
ttaaacaaca ccctcgaaag atcattcatt 1440 
aaggatggtt caacatatgc aaatcaatca 1500 
acaaaaacca tatgattatt tcactttatg 1560 
ctccatgata aaaaccctca aaaaaccagg 1620 
ggctcacacc tgcgatccca gcactctggg 1680 
ggagcttgag actagcctgg gcaacaaaat 1740 
aaattagcca ggcatgatgg catatgcctg 1800 
gagaatcact taagcctagg aggtcgaggc 1860 
ccagcctaga caacagaaca agaccccact 1920 
agggagggag aagggaggag gaggagaagg 1980 
ggaagggaaa gaggaagaag aagaaacata 2040 
accgaggtag tattatgagg aaaaaccgaa 2100 
agggcccact ttcaccactg tgattcaaca 2160 
gataagagaa agaaataaaa ggcatccaaa 2220 
tgcagatgat atgatcttat atctggaaaa 2280 
gctgaaattt ggtacagcag gatacaaaat 2340 
ttccaacagc aaacaatctg aaaaagaaac 2400 
gctaggaact aaccaaagaa gtgaaagatc 2460 
aagaaattga agagggcaca aaaaaagaaa 2520 
aaacactgct aaaatgtcca tactacccaa 2580 
taaaatacta atgacgttct tcacagaaat 2640 
ccacaaaaga cccagaatag ccaaagctat 2700 
cacattaccc gacttcaaat tatactacaa 2760 
gcataaaaac agatgagaca tggaccagag 2820 
atgcatctac agtgaactca tttttgacaa 2880 
taatctcttc aataaatggt gctggaggaa 2940 
agaactctgc ctctcaccat atacaaaagc 3000 
aaaccccaaa ctttgcaact actaaaagaa 3060 
gtgggcaaag acttcttgag taattccctg 3120 
aaacgggatc atatcaagtt aaaaagcttc 3180 
aagagacaac ccacagaatg ggagaatata 3240 
ataaccagta tatataagga gctcaaacta 3300 
tctcaaaaat aagcaaaaga tctgggtaga 3360 
aacaggcacc tgaaaatgtg ctcaacacca 3420 
actatgagag atcatctcat cccagttaaa 3480 
aaatgccagt gaggatgtgg ataaaaggaa 354 0 
ctgccaccac catggagaac agtttgaaag 3600 
tacagcaatc ccattgctag gtatatactc 3660 
atctccactc ccacatttac tgcagcactg 3720 
cagtgtccac caacagacga atggaaaaag 3780 
tacgcagcca taaaaaagaa tgagatcctg 384 0 
agcacgttaa gtgaaataag ccaggcacag 3900 
cgtgggagca aaaattaaaa caactgacac 3960 
ggcgggggac agggtgacta gagccaacaa 4 020 
agagtataat tgggctgttt gtaacacaaa 4080 
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gaaaggataa atgcttgaag gtgacagata 
ttgtatgcct gtatcaaaat atctcatgta 
aattaaaatt ttaatggcca ggcacggtgg 
gccgaggcgg gtggatcacc tgaggtcagg 
aaccctgtct ctactaaaga tacaaaaatt 
ccaactactc aggaggctga gacaggagaa 
tgagccgaga tcatgccact gcactgcagc 
acaaaaacaa aaaaaagaag attaaaattg 
ccactatatc agaagttaaa aattaaaaca 
aaataagaac aatgtatgtg gggtttctag 
tggcagaaat gtgaggaggg aacagtggaa 
taagtgactt aattttaacc aaagacaggc 
cctaaaacaa ctgctaataa tggcgaaagg 
tatctctaaa atcgagctgc agaattggca 
tgcttttttt cttgtgtgct tggagatttt 
atctgcatga atcctgaaac gaaaaatggt 
tggcaggaag caggtggctc tgtggacctg 
aagacccagg tgcaaggcag aggcctgatg 
gggcgatgag aagcctgcct cgttggtgag 
gcaaagactg ctctggatac catctggaaa 
agcctcctgc tcaaacccag gccagcagct 
agaggagtca aggcacctcg aagtatggct 
aaggtgtatt ctgagggaag cttgagttag 
gcacccttct caagggaaaa ccagacgccc 
ccctctcttg ccctcgcggt tcctgatcgg 
gcccgtgctg aggaccctct tgcaaagggc 
ctgagcctgg cttaataaca aactgggatg 
caaagaccta attccatgag taaattcaac 
tcttaatatt ttcttaaatt tcatcaaata 
aaaacaggaa ctgagctatg tttgccaagg 
atttttcgcc ctaagtactt tttattggtt 
gtacacgagg agaggcctgg gcggcagggc 
gtccccggcc tgggaggctg acagcaggac 
tcgggcaacg cgaaggcggc cacgctgcgt 
gcccacccac accaacccag gaagtcacgg 
cttgcctgcc tgcttccctg ggcgggtcaa 
atgtaaatta cacgactctg ctgacgggga 
cccaaggact gaatgattcc agcaacttct 
tacaaacacc actcttttac taggcccaca 
agtccaggag agatgaggct gctttcagcc 
agcctgttcc tctagactag cagaccctgg 
cgctgcttcc cgagggcgcc atctgccctg 
cagccctgtc tccacaccct ccgcctccag 
ctgggtgggc cgtgttccag cgctactgtc 
acgtagctcg cacggttcct cctcacatgg 
gcgtcgaagg gaggagattc tgcgcctccc 
cgtggccccc gatgcaggtt cctggcgtcc 
tccccgtctc ctgccatctg ccggggcctg 
tccacgtcca gctgcgtgtg tccctgcccg 
acgggggcgt ggtgggccag ggcgctcttg 
agtgcctgtc ctcacctagg cccacgggca 
cccgcccttc tctgcccagc actttcctgc 
ttccacaagc actaagcatc ctcttcccaa 
gccccacagc cccgggaatt cacgtgacta 
ccgacccccg ctgttttatc ttaatagcta 
tttaacaaac tggttaaaca aacgggccca 
gaggaacatg ccgcttataa agcctgcagg 
tgccacctcc atgggatacg cacgcaacat 
aggggagtgg tcaggggggt taaggacggt 
ccttttacta aagccagctc cctggttctg 
cataggggag tggggatggg ggaacccgga 
cctgggcagg ataatgctct agagacgccc 
aacccgcccg gccccagggc ctttgcaggt 
atccttcggg actacccgca ggcccgaaaa 
aggagggtca gaggggggca gcctcaggac 



ccccatttac cctgatgtga ttattacaca 4140 

tgccatagat ataaacccta ctatattaaa 4200 

ctcatgtccg taatcccagc actttgggag 4260 

agtctgaaac cagtctggcc accatgatga 4320 

agccaggcgt ggtggcacat acctgtagtc 4380 

ttgcttgaac ctgggaggcg gaggttgcag 4440 

ctgggtgaca gagcaagact ccatctcaaa 4500 

taatttttat gtaccgtata aatatatact 4560 

attataaaag gtaattaacc acttaatcta 4620 

cttctgaaga agtaaaagtt atggccacga 4680 

gttactgttg ttagacgctc atactctctg 4740 

tgggagaagt taaagaggca ttccataagc 4800 

taatctctat taattaccaa caactacaga 4 860 

cgtctgacca caccgtcctc tcattcacgg 4920 

cgattgtgtg ttcgtgtttg gttaaactta 4980 

ggtgacttcc tccagaagaa ttagagtacc 5040 

agccacttca atcttcaagg gtctctggcc 5100 

acccgaggac aggaaagctc ggatgggaag 5160 

cagcgcatga agtgccctta tttacgcttt 5220 

aggcggccag cgggaatgca aggagtcaga 5280 

atggcgccca cccgggcgtg tgccagaggg 5340 

taaatctttt tttcacctga agcagtgacc 5400 

gtgccttcct taaaacagaa agtcatggaa 5460 

gctctgcggc catttacctc tttcctctct 5S20 

gacagagtga cccccgtgga gcttctccga 5580 

tccacagacc cccgccctgg agagaggagt 564 0 

tggctggggg cggacagcga cggcgggatt 5700 

ctttccacat ccgaatggat ttggatttta 5760 

acattcagga ctgcagaaat ccaaaggcgt 5820 

tccaaggacc taataaccat gctcagaggg 5880 

ttcataaggt ggcttagggt gcaagggaaa 5940 

tatgagcacg gcagggccac cggggagaga 6000 

cactgaccgt cctccctggg agctgccaca 6060 

gtgactcagg accccatacc ggcttcctgg 6120 

agctctgaac ccgtggaaac gaacatgacc 6180 

gggtaatgaa gtggtgtgca ggaaatggcc 6240 

ccgttccttc catcattatt catcttcacc 6300 

tcgggtgtga caagccatga caaaactcag 6360 

gagcacggsc cacacccctg atatattaag 6420 

accaggctgg ggtgacaaca gcggctgaac 64 80 

caggcacccc cccagattct agggcctggt 654a 

gagactcagc ctggggtgcc acactgaggc 6600 

gcctcagctt ctccagcagc ttcctaaacc 6660 

tcacctgtcc cactgtgtct tgtctcagcg 6720 

ggtgtctgtc tccttcccca acactcacat 6780 

agactggctc ctccgagcct gaacctggct 6840 

ggctgcacgc tgacctccat ttccaggcgc 6900 

ccggtgtgtt cttctgtttc tgtgctcctc 6960 

ctagggtctc ggggttttta taggcatagg 7020 

ggaaatgcaa catttgggtg tgaaagtagg 7080 

caggcctggg gatggagccc ccgccaggga 7140 

ccccctccct ctggaacaca gagtcjgcagt 7200 

aagacccagc attggcaccc ctggacattt 7260 

cgcacatcat gtacacactc ccgtccacga 7320 

caaagcaggg aaatccctgc taaaatgtcc 7380 

tccgcacggt ggacagttcc tcacagtgaa 744 0 

caccccaagg gaattacgct gagtcaaaac 7500 

gctcaaaaag aaagaatttc accccatggc 7560 

gggggcggca gctgggggct actgcacgca 7620 

atggtattgg ctcagttatg ggagaccaac 7680 

ggccgtgcca tcttxgccat gcccgagtgt 7740 

acgtcctgat tcccccaaac ctgtggacag 7800 

gtgatctccg tgaggacccc gaggtctggg 7860 

gtaacccagg ggttctggga agaggcgggc 7920 

gatggaggca gtcagcctga ggctgaaaag 7980 
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ggagggaggg cctcgagccc aggcctgcaa 
gggaccctcc acggagcctg cagcaggaag 
atcgtggacc tccggcctcc gtgccatagg 
gtgtgtgggg atttgcagaa gcaacaggaa 
aaaacaaagg tttacagaaa catccaagga 
ggcaggcacg agtgatttta tttagctatt 
gttacgctct tgttgcccag gctggagtgc 
cgtctcctgg gttcaagcaa ttctcgtgcc 
gtgcaccacc acacccggct aattttgtac 
gtcaagctga tctcaaaatc ctgacctcag 
ctgggattac aggcatgagc cactgcacct 
ggctcaagtc acacccactg gtaaggagct 
gttaccctcc tttgatattt tctgtaattc 
catattcaca gtttctgtga ccacctgtta 
gaggctgcag gcttcaggtc ccagtggggt 
atcagggcgc aagtgtggac actgtcctga 
gtagaaatta aagtccatcc ctcctactct 
ccaggggcag aggagttcct ctcactcctg 
caccgctggt actgaatcca ctgtttcatt 
ggtttcactc ttgttgctca ggctggaggg 
gcccctgcct cccaggttca agtgattctc 
caggcacccg ccaccatgcc cagctaattt 
ggggctcacc atgttggcca ggctggtctc 
tctgcctcct aaagtgctgg gattacaggt 
tctgtttaga aacatctggg tctgaggtag 
tttaagccaa tgatagaatt tttttattgt 
gatgactaag acatcatcag cttttcaaag 
gtcttctggg tatcagcaat cttcattgaa 
ggtgttaatt actccagcat aatcttctgc 
tgtgttttct atgttggctt ctctgcagag 
tggaacaaat tttccaaacc gcccctttgc 
ccctttaaaa aggcttaggg atcactaagg 
agtatttaca agacgaggct aacccccagc 
ctgttcaaat gctagctcca taaataaagc 
aaggttacat ttaaggttgc gtttgttagc 
atccctgcaa ggcctcggga gacccagaag 
aacccggagt ccggattcct gggaagtcct 
ggtctggagg ggaccagtgg ccgtgtggct 
agctctgcag tccgaggctt ggagccaggt 
tgcgggcggg atgtgaccag atgttggcct 
gtcaaggccg ttgtggctgg tgtgaggcgc 
ccatttceca ccctttctcg acgggaccgc 
tttgctcatg gtggggaccc ctcgccgcct 
tgtcaaggag cccaagtcgc ggggaagtgt 
gcccgtccag ggagcaatgc gtcctcgggt 
cctccccttc acgtccggca ttcgtggtgc 
gaggcagccc tgggtctccg gaccaggcca 
cccagggcct ccacatcatg gcccctccct 
cctctctccg ctggggccct cgctggcgtc 
ggcggggaag cgcggcccag acccccgggt 
ggccgggctc ccagtggatt cgcgggcaca 
gagggactgg ggacccgggc acccgtcctg 
cgcggacccc gccccgtccc gacccctccc 
cccagcccct ccccttccct tccgcggccc 
agcgctgcgt cctgccgcgc acgtgggaag 

<210> 4 
c211> 104 
<212> DNA 

<213> Homo sapiens 



gcgcctccag aagctggaaa aagcggggaa 8040 
gcacggctgg cccttagccc accagggccc 8100 
agggcactcg cgctgccctt ctagcatgaa 8160 
acccatgcac tgtgaatcta ggattatttc 8220 
cagggctgaa gtgcctccgg gcaagggcag 8280 
ttattttatt tacttactct ctgagacaga 8340 
agcggcatga tcttggctca ctgcaacctc 8400 
tcagcctccc aagtagctgg gatttcaggc 8460 
ttttagtaga gatgggcttt caccatgttg 8520 
gtgatccgcc cacctcagcc tcccaaagcg 8580 
ggcccattta accattttaa aacttccctg 8640 
catggagttc aatttcccct ttactcagga 8700 
ttcgtagact ggggatacac cgtctcttga 8760 
tcccatggga cccactgcag gggcagctgg 8820 
tgccatctgc cagtagaaac ctgatgtaga 8880 
atctcaatgt ctcagtgtgt gctgaaacat 8940 
actgggattg agccccttcc ctatcccccc 9000 
tggaggaagg aatgatactt tgttattttt 9060 
tgttggtttg tttgttttgt tttgagaggc 9120 
agcgcaatgg cgcgatcttg gcttactgca 9180 
ctgcttccgc ctcccatttg gctgggatta 9240 
tttgtatctt tagcagagac gggggtgggt 9300 
gaacttctga cctcagatga tccacctgcc 9360 
gtgagccace atgcccagcc cagaacttac 9420 
gaagctcacc ccactcaagt gttgtggtgt 9480 
tgttagaaca cccttgatgt tttacactgt 9540 
acacactaac tgcacccata atactggggt 9600 
tgccgggagg cgtttcctcg ccatgcacat 9660 
tcccatttct tctcttccct cttttaaaat 9720 
aaccagtgta agctacaact taacttttgt 9780 
cctagtggca gagacaattc acaaacacag 9840 
ggatttctag aagagcgacc tgtaatccta 9900 
gagcgtgaca gcccagggag ggtgcgaggc 9960 
aatttcctcc ggcagtttct gaaagtagga 10020 
atttcagtgt ttgccgacct cagctacagc 10080 
tttctcgccc ccttagatcc aaactcgagc 10140 
cagctgtccc gcggttgtgc cggggcccca 10200 
tctactgctg ggctggaagt cgggcctcct 10260 
gcctggaccc cgaggctgcc ctccaccctg 10320 
catctgccag acagagtgcc ggggcccagg 10380 
ccggtgcgcg gccagcagga gcgcctggct 10440 
cccggtgggt gactaacaga tttggggtgg 10500 
gagaacctgc aaagagaaat gacgggcctg 10560 
tgcagggagg cactccggga ggtcccgcgt 10620 
tcgtccccag ccgcgtctac gcgcctccgt 10680 
ccggagcccg acgccccgcg tccggacctg 10740 
gcggccaaag ggtcgccgca cgcacccgtt 10800 
cgggttaccc cacagcctag gccgattcga 10860 
cctgcaccct gggagcgcga gcggcgcgcg 10920 
ccgcccggag cagctgcgct gtcggggcca 10980 
gacgcccagg accgcgctcc ccacgtggcg 11040 
ccccttcacc tcccagctcc gcctcctccg illOO 
gggtccccgg cccagccccc tccgggccct 11160 
cgccctctcc tcgcggcgcg agtttcaggc 11220 
ccctggcccc ggccaccccc gcgatg 11276 



<400> 4 

gtgggcctcc ccggggtcgg cgtccggctg gggttgaggg cggccggggg gaaccagcga 60 
catgcggaga gcagcgcagg cgacccaggg cgctcccccc gcag 104 
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<210> 5 

<211> 8616 

<212> DNA 

<213> Homo sapiens 

<400> 5 

gtgaggaggt ggtggccgtc gagggcccag 
aaaagggggc aggcagagcc ctggtcctcc 
ttttcgctca ggacgtcgag tggacacggt 
gtttgcataa acttacgagg ttcaccttca 
cgaggccaga gcagtgaaca gaggaggctg 
tggggagaag tgtctggaag cacagacgct 
tcctcttcgc aatttcaagg gtgggaatga 
gggtgggagg taagggtttt gcaggtgcac 
agatttaatt gtgtgttgac ggccaggtgc 
gggaagctga ggcaggtgga tcacctgagg 
ggtgaaaccc tatctgtact aaaaatacaa 
taatcccagc tacttgggag gctgaggcag 
tgcagtgagc tgagattgtg ccattgtact 
ctttaaaaaa aaaaagtgtt cgttgattgt 
actgttctcc agcacagatc ctggtcccat 
agaggacagc agatggctcc acctgctgag 
atggtgctgc tgggccctgc cgtgtcccca 
cctccgctcc agcccccttt tggctcccag 
gaagtcccga tttcaccccc tccccacaaa 
cagacaagga gggtgacctt cttggggctc 
aaaagtcata taacatgaga ttggcactcc 
tgctaactcg gcggtgttta cagcaggttg 
gtccctaccc atcgaacggc agctgcctca 
agtcagataa gcgtcatgca acccagtttt 
gagagtttga gttctctgat caggactctg 
aggtcacaat ctgcccctgg cttatgcagg 
cacgtgcagg gtgagtgagg cgttgccccc 
ggcgcggccc ccgggtgtcc ctgtcccgtg 
ccctgtcacg tgtagggtga gtgaggcgcc 
gagtgaggcg tggtccccgg gtgtccctgt 
gggtgtccct gtcacgtgca gggtgagtga 
tagggtgagt gaggcgcggc cccagggtgt 
gtccctgggt gtccctccca ggtatagggt 
cacgtgcagg gtgagtgagg cgcggccccc 
ggcgctgtcc ctgggtgtcc ctgtctcgtg 
ccttggcgtt tgctcacttg agcttgctcc 
gcgccggttg cccattgcct gggtagatgg 
cttttctgat gctcggctct tcttggtcac 
ggactgcagg ctctcgcctc ccgcgtgcca 
gcctctgttg ggcctggctt gctcaccacg 
tctcccagct tgtctcatgc cgaggctgga 
ttgctggaga catcccagaa agggttctct 
cccctcactt gtcctgtttt ctcccaagct 
gcaacgcttg tcaccttatt ctgggcacct 
ccagtcgccc cctcacatgg attgacgtcc 
cctgctctga gacccacgtg gagggccggt 
ttgggtctta gttttgaatt tcactgattt 
gctttttctt ggtttattct ttcattcctt 
cctctaagtg ctgccttacc tgcaccctgt 
cactttcaag tgttcttaaa atacttcaaa 
ctgtgatttt tttctttgtg cacgctgtgt 
cttttaagta ttctttagct tattctgtga 
gtttatgttc aagatatgta gagtatcaag 
ttattgattt ctaactcagt tgtgtagtgg 
ggagccttgc tttgtgatct agtgtgtgca 
acatcctgtc aatagtgggc atgcatgttc 
aagcttctgt ctccttctag atgcatgaaa 
9999gatggg tctgttcatt tcttctcgtt 
gcatgcacgt ggtagaattt ttatcttcct 



gccccagagc tgaatgcagt aggggctcag 60 
tgtctccatc gtcacgtggg cacacgtggc 120 
gatctctgcc tctgctctcc ctcctgtcca 180 
cgttttgatg gacacgcggt ttccaggcgc 240 
ggcgcggcag tggagccggg ttgccggcaa 300 
ctggcgaggg tgcctgcagg ttacctataa 360 
gaggtgggga cgagaacccc ctcttcctgg 420 
gtggtcagcc aatatgcagg tttgtgttta 480 
ggtggctcac gccggtaatc ccagcacttt 54 0 
tcaggagttt gagaccagcc tgaccaacat 600 
aaattagctg ggcatggtgg tgtgtgcctg 660 
gagaatcact tgaacccagg aggcggaggc 720 
ccagcctggg cgacaagagt gaaactctgt 780 
gccaggacag ggtagaggga gggagataag 840 
ctttaggtat gaagagggcc acatgggagc 900 
gaagggacag tgtttgtggg tgttcagggg 960 
ccctgttttt ctggatttga tgttgaggaa 1020 
tgctcccagg ccctaccgtg gcagctagaa 1080 
ctcccaagac atgtaagact tccggccatg 114 0 
ttttttttct ttttttcttt ttatggtggc 1200 
taacaccgtt ttctgtgtac agtgcagaat 1260 
cttgaaatgc tgcgtcttgc gtgactggaa 1320 
cacctgctgc ggctcaggtg gaccacgccg 1380 
gctttttgtg ctccagcttc cttcgttgag 1440 
cctgtcattg ctgttctctg acttcagatg 1500 
gagtgaggcg tggtccccgg gtgtccctgt 1560 
aggtgtccct gtcacgtgta gggtgagtga 1620 
cagcgtgatt gaggtgtggc ccccgggtgt 1680 
atccccgggt gtccctgtca cgtgtagggt 174 0 
cccgtgcagg gtgagtgagg cactgtcccc 1800 
ggcgcggtcc ccgggtgtcc ctctcaggtg 1860 
ccctgtcacg tgtagggtga gtgaggcacc 1920 
gagtgaggca ctgtccccgg gtgtccctgt 1980 
gggtgtccct ctcaggtgca gggtgagtga 2040 
tagggtgagt gaggctctgt ccccaggtgt 2100 
tgaatgtttg ctctttctat agccacagct 2160 
tgcaggcgca gtgctggtcc ccaagcctat 2220 
ctctccgttc cattttgcta cggggacacg 2280 
ggcactgcag ccacagcttc aggtccgctt 2340 
tgcccgccac atgcatgctg ccaatactcc 2400 
ctctgggctg cctgtgtctg ctgccacgtg 2460 
gtgccctgaa ggaaagcaag tcaccccagc 2520 
gcccctctgc ttggccccct tgggtgggtg 2580 
gccgctcatt gcttaggctg ggctctgcct 264 0 
agccacaggt tggagtgtct ctgtctgtct 2700 
gtctccgcca gccttcgtca gacttccctc 2760 
acctctgacg tttctatctc tccattgtat 2820 
ttctagcttc ttagtttagt catgcctttc 2880 
gttttgatgt gaagtaatct caacatcagc 2940 
gtgttaatac ttcttttaag tattcttatt 3000 
tttgacgtga aatcattttg atatcagtga 3060 
tttctttgag cagtgagtta tttgaacact 3120 
atacgtagag tattttaagt tatcatttta 3180 
tctgtataat accaattatt tgaagtttgc 3240 
tggtttccag aactgtccat tgtaaatttg 3300 
actatatcca gcttattaag gtccagtgca 3360 
ttccaagaag gaggccatag tccctcacct 3420 
tggtagcatt tatgtgaggc attgttaggt 3480 
gatgagtgaa tcttttggag acttctatgt 3540 
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ctctagtaat ctagtaattc tttttttaaa ttgctcttag tactgccaca ctgggcttct 3600 

tttgattagt attttcctgc tgtgtctgtt ttctgccttt aatttatata tatatatata 3660 

tttttttttt ttttgagaca gagtcttggt ctgtcgccca gggtgagtgc agtggtgtga 3720 

tcacaggtca gtgtaacttt taccttctgg cctgagccgt cctctcaccc cagcctcctg 3780 

agtagctgga actgcagaca cgcaccgcta cacctggcta atttttaaat tttttctgga 3840 

gacagggtct tgctgtgttg cccaggctgg tctcaaactc ttggactcaa gggatccatc 3900 

tacctcggct tcccaaagtg ctgaattaca ggcatgagcc accatgtctg gcctaatttt 3960 

caacaccttt atattcttat agtgtgggta tgtcctgtta acagcatgta ggtgaatttc 4020 

caatccagtc tgacagtcgt tgtttaactg gataacctga tttattttca tttttttgtc 4080 

actagagacc cgcctggtgc actctgattc tccacttgcc tgttgcatgt cctcgttccc 4140 

ttgtttctca ccacctcttg ggttgccatg tgcgtttcct gccgagtgtg tgttgatcct 4200 

ctcgttgcct cctggtcact gggcatttgc ttttatttct ctttgcttag tgttaccccc 4260 

cgatcttttt attgtcgttg tttgcttttg tttattgaga cagtctcact ctgtcaccca 4320 

ggctggagtg taatggcaca atctcggctc actgcaacct ctgcctcctc ggttcaagca 4380 

15 gttctcattc ctcaacctca tgagtagctg ggattacagg cgcccaccac cacgcctggc 4440 

taatttttgt atttttagta gagataggct ttcaccatgt tggccaggct ggtctcaaac 4500 

tcctgacctc aagtgatctg cccgccttgg cctcccacag tgctgggatt acaggtgcaa 4560 

gccaccgtgc ccggcatacc ttgatctttt aaaacgaagt ctgaaacatt gctacccctg 4620 

tcctgagcaa taagaccctt agtgtatttt agctctggcc accccccagc ctgtgtgctg 4680 

20 ttttccctgc tgacttagtt ctatctcagg catcttgaca cccccacaag ctaagcatta 4740 

ttaatattgc tttccgtgtt gagtgtttcc gtagctttgc ccccgccctg cttttcctcc 4800 

tctgttcccc gtctgtcttc cgtctcaggc ccgccgtctg gggtcccctt ccttgtcctt 4860 

cgcgtggttc ttctgtcttg ttattgctgg taaaccccag ctttacctgt gctggcctcc 4920 

acggcatcca gcgacgcccg gggacctctg cttatgatgc acagatgaag atgtggagac 4980 

25 ccacgaggag ggcggtcacc ttggcccgtg agtgtctgga gcaccacgtg gccagcgttc 504 0 

ctcagccagt gagtgacagc aacgtccgct cggcctgggt tcagcctgga aaaccccagg 5100 

catgtcgggg tctggtggct ccgcggtgtc gagtttgaaa tcgcgcaaac ctgcggtgtg 5160 

gcgccagccc cgacggtgct gcctggcggg ggagtgtctg cttcctccct tctgcttggg 5220 

aaccaggaca aaggatgagg ctccgagccg ttgtcgccca acaggagcat gacgtgagcc 5280 

30 atgtggataa ttttaaaatt tctaggctgg gcgcggtggc tcacgcctgt aatcccagca 5340 

ctttgggagg ccaaggcggg tggaccacga ggtcaggagg tcgagaccat cccggccaac 5400 

atgatgaaac cccatctgta ctaaaaacac aaaaattagc tgggcgtggt ggcgggtgcc 5460 

cgtaatccca gctactcggg aggctgaggc aggagaattg cttgaacctg ggagctggaa 5520 

gttgcagtga gccgacattg caccactgca ctccagcctg gcaacacagc gagactctgt 5580 

35 ctcaaaaaaa aaaaaaaaaa aaaaaaaaaa aactctagta gccacattaa aaaagtaaaa 5640 

aagaaaaggt gaaattaatg taataataga ttttactgaa gcccagcatg tccacacctc 5700 

atcattttag ggtgttattg gtgggagcat cactcacagg acatttgaca ttttttgagc 5760 

tttgtctgcg ggatcccgtg tgtaggtccc gtgcgtggcc atctcggcct ggacctgctg 5820 

ggcttcccat ggccatggct gttgtaccag atggcgcagg tccgggatga ggtcgccagg 5880 

40 ccctcagtga gctggatgtg cagtgtccgg atggtgcacg tctgggatga ggtcgccagg 594 0 

ccctgctgtg agctggacgt gtggtgtctg gatggtgcag gtcaggggtg aggtctccag 6000 

gcccccggcg agctggaggt atggagtccg gatgatgcag gtccggggtg aggtcgccag 6060 

gccctgctgt gagctggatg tgtggtgtct ggatggtgca ggtcaggggt gaggtctcca 6120 

ggccctcggt aagctggagg tatggagtcc ggatgatgca ggtccggggt gaggtcgcca 6180 

45 ggccctgccg tgagctggat gtgtggtgtc tggatggtgc aggtctgggg tgaggtcacc 6240 

aggccctgcg gtgagctggg tgtgcggtgt ctggatggtg caggtctgga gtgaggtcgc 6300 

cagacggtgc cagaccatgc ggtgagctgg atatgcggtg tccggatggt gcaggtctgg 6360 

ggcgaggttg ccaggccccg ctgtgagttg gatgtggggt gtccggatgc tgcaggtccg 6420 

gtgcgaggtc accaggcccc gctgtgagct ggatgtgtgg tgtctggatg gtgcaggtct 64 80 

50 ggggtgaagg tcgccaggcc cctgcctgtg agctggatgt gtggtgtctg gatggtgcag 6540 

gtctggagtg aggtcgccag gccctcggtg agctggatgt gcagtgtcca gatggtgcag 6600 

gtccggggtg aggtcgccag accctgcggt gagctggatg tgcggtgtct ggatggtgca 6660 

ggtctggagt gaggtcgcca ggccctcggt gagctggatg tatggagtcc ggatggtgcc 6720 

ggtccggggt gaggtcgcca gaccctgctg tgagctggat gtgcggtgtc tggatggtac 6780 

55 aggtctggag tgaggtcgcc agaccctgct gtgagctgga tatgcggtgt ccggatggtg 684 0 

caggtcaggg gtgaggtctc caggccctcg gtgagctgga ggtatggagt ccggatgatg 6900 
caggtccggg gtgaggtcgc caggccctgc tgtgaactgg atgtgcggcg tctggatggt 6960 

gcaggtctgg ggtgtggtcg ccaggccctc ggtgagctgg aggtatggag tccggatgat 7020 
gcaggtccgg ggtgaggtcg ccaggccctg ctgtgagctg gatgtgcggc gtctggatgg 7080 

tgcaggtctg gggtgtggtc gccaggccct cggtgagctg gaggtatgga gtccggatga 7140 

tgcaggtccg gggtgaggtt gccaggccct gctgtgagct ggatgtgctg tatccggatg 7200 

gtgcagtccg gggtgaggtc gccaggccct gctgtgagct ggatgtgctg tatccggatg 7260 
gtgcaggtct ggggtgaggt caccaggccc tgcggtgagc tggttgtgcg gtgtccggtt 7320 
gctgcaggtc cggggtgagt tcgccaggcc ctcggtgagc tggatgtgcg gtgtccccgt 7380 
gtccggatgg tgcaggtcca gggtgaggtc gctaggccct tggtgggctg gatgtgccgt 744 0 
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gtccggatgg tgcaggtctg gggtgaggtc gccaggcctt tggcgagctg gatgtgcggt 7500 
gtctgcatgg tgcaggtctg gggtgaggtc gccaggccct tggtgggctg gatgtgtggt 7560 
gtccggatgg tgcaggtccg gcgtgaggtc gccaggccct gctgtgagct ggatgtgcgg 7620 
tgtctggatg gtgcaggtcc ggggtgaggt agccaaggcc ttcggtgagc tggatgtggg 7680 
5 gtgtccggat ggtgcaggtc cggggtgagg tcgccaggcc ctgcggttag ctggatatgc 7740 

ggtgtccgga tggtgcaggt ccggggtgag gtcaccaggc cctgcggtta gctggatgtg 7800 
cggtgtctgg atggtgcagg tccggggtga ggtcgccagg ccctgctgtg agctggatgt 7860 
gctgtatccg gatggtgcag gtccggggtg aggtcgccag gccctgcagt gagctggatg 7920 
tgctgtatcc ggatggtgca ggtctggcgt gaggtcgcca . ggccctgcgg ttagctggat 7980 

10 atgcggtgtc ggatggtgca ggtccggggt gaggtcacca ggccctgcgg ttagctggat 8040 

gtgcggtgtc cggatggtgc aggtctgggg tgaggtcgcc aggccctgct gtgagctgga 8100 
tgtgctgtat ccggatggtg caggtccggg gtgaggtcgc caggccctgc ggtgagctgg 8160 
atgtgctgta tccggatggt gcaggtctgg cgtgaggtcg ccaggccctg cggtgagctg 8220 
gatgtgcagt gtacggatgg tgcaggtccg gggtgaggtc gccaggccct gcggtgggct 8280 

15 gtatgtgtgt tgtctggatg gtgcaggtcc ggggtgagtt cgccaggccc tgcggtgagc 8340 

tggatgtgtg gtgtctggat gctgcaggtc cggggtgagt tcgccaggcc ctcggtgagc 8400 
tggatatgcg gtgtccccgt gtccgaatgg tgcaggtcca gggtgaggtc gccaggccct 8460 
tggtgggctg gatgtgccgt gtccggatgg tgcaggtctg gggtgaggtc gccaggccct 8520 
tggtgagctg gatgtgcggt gtccggatgg tgcaggtccg gggtgaggtc accaggccct 8580 

20 cggtgatctg gatgtggcat gtccttctcg tttaag 8616 

<210> 6 
<211> 2089 
<212> DNA 
25 <213> Homo sapiens 

<400> 6 

gtactgtatc cccacgccag gcctctgctt ctcgaagtcc tggaacacca gcccggcctc 60 
agcatgcgcc tgtctccact tgcctgtgct tccctggctg tgcagctctg ggctgggagc 120 

30 caggggcccc gtcacaggcc tggtccaagt ggattctgtg caaggctctg actgcctgga 180 

gctcacgttc tcttacttgt aaaatcagga gtttgtgcca agtggtctct agggtttgta 24 0 
aagcagaagg gatttaaatt agatggaaac actaccacta gcctccttgc ctttccctgg 300 
gatgtgggtc tgattctctc tctctttttt ttttcttttt tgagatggag tctcactctg 360 
ttgcccaggc tggagtgcag tggcataatc ttggctcact gcaacctcca cctcctgggt 420 

35 ttaagcgatt caccagcctc agcctcctaa gtagctggga ttacaggcac ctgccaccac 480 

gcctggctaa tttttgtact tttaggagag acggggtttc accatgttgg ccaggctggt 540 
ctcgaactca tgacctcagg tgatccaccc accttggcct cccaaagtgc tgggtttaca 600 
ggctaagcca ccgtgcccag cccccgattc tcttttaatt catgctgttc tgtatgaatc 660 
ttcaatctat tggatttagg tcatgagagg ataaaatccc acccacttgg cgactcactg 720 

40 cagggagcac ctgtgcaggg agcacctggg gataggagag ttccaccatg agctaacttc 780 

taggtggctg catttgaatg gctgtgagat tttgtctgca atgttcggct gatgagagtg 840 
tgagattgtg acagattcaa gctggatttg catcagtgag ggacgggagc gctggtctgg 900 
gagatgccag cctggctgag cccaggccat ggtattagct tctccgtgtc ccgcccaggc 960 
tgactgtgga gggctttagt cagaagatca gggcttcccc agctcccctg cacactcgag 1020 

45 tccctggggg gccttgtgac accccatgcc ccaaatcagg atgtctgcag agggagctgg 1080 

cagcagacct cgtcagaggt aacacagcct ctgggctggg gaccccgacg tggtgctggg 114 0 
gccatttcct tgcatctggg ggagggtcag ggctttccct gtgggaacaa gttaatacac 1200 
aatgcacctt acttagactt tacacgtatt taatggtgtg cgacccaaca tggtcatttg 1260 
accagtattt tggaaagaat ttaattgggg tgaccggaag gagcagacag acgtggtggt 1320 

50 ccccaagatg ctccttgtca ctactgggac tgttgttctg cctggggggc cttggaggcc 1380 

cctcctccct ggacagggta ccgtgccttt tctactctgc tgggcctgcg gcctgcggtc 1440 
agggcaccag ctccggagca cccgcggccc cagtgtccac ggagtgccag gctgtcagcc 1500 
acagatgccc aggtccaggt gtggccgctc cagcccccgt gcccccatgg gtggttttgg 1560 
gggaaaaggc caagggcaga ggtgtcagga gactggtggg ctcatgagag ctgattctgc 1620 

55 tccttggctg agctgccctg agcagcctct cccgccctct ccatctgaag ggatgtggct 1680 

ctttctacct gggggtcctg cctggggcca gccttgggct accccagtgg ctgtaccaga 174 0 
gggacaggca tcctgtgtgg aggggcatgg gttcacgtgg ccccagatgc agcctgggac 1800 
caggctccct ggtgctgatg gtgggacagt caccctgggg gttgaccgcc ggactgggcg 1860 
tccccagggt tgactatagg accaggtgtc caggtgccct gcaagtagag gggctctcag 1920 

60 aggcgtctgg ctggcatggg tggacgtggc cccgggcatg gccttcagcg tgtgctgccg 1980 

tgggtgccct gagccctcac tgagtcggtg ggggcttgtg gcttcccgtg agcttccccc 204 0 
tagtctgttg tctggctgag caagcctcct gaggggctct ctattgcag 2089 
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<210> 7 

<211> 687 

<212> DNA 

<213> Homo sapiens 



<400> 7 

gtggctgtgc tttggtttaa cttccttttt aaacagaagt gcgtttgagc cccacatttg 60 
gtatcagctt agatgaaggg cccggaggag gggccacggg acacagccag ggccatggca 120 
cggcgccaac ccatttgtgc gcacagtgag gtggccgagg tgccggtgcc tccagaaaag 180 
cagcgtgggg gtgtaggggg agcccctggg gcagggacag gctctgagga ccacaagaag 240 
cagccgggcc agggcctgga tgcagcacgg cccgaggtcc tggatccgtg tcctgctgtg 300 
gtgcgcagcc tccgtgcgct tccgcttacg gggcccgggg accaggccac gactgccagg 360 
agcccaccgg gctctgagga tcctggacct tgccccacgg ctcctgcacc ccacccctgt 420 
ggctgcggtg gctgcggtga ccccgtcatc tgaggagagt gtggggtgag gtggacagag 480 
gtgtggcatg aggatcccgt gtgcaacaca catgcggcca ggaacccgtt tcaaacaggg 540 
tctgaggaag ctgggagggg ttctaggtcc cgggtctggg tggctgggga cactggggag 600 
gggctgcttc tcccctgggt ccctatggtg gggtgggcac ttggccggat ccactttcct 660 
gactgtctcc catgctgtcc ccgccag 687 

<210> 8 . . 

<211> 494 

<212> DNA 

<213> Homo sapiens 



<400> 8 

gtgggtgccg gggacccccg tgagcagccc tgctggacct tgggagtggc tgcctgattg 60 
gcacctcatg ttgggtggag gaggtactcc tgggtgggcc gcagggagtg caggtgaccc 120 
tgtcactgtt gaggacacac ctggcaccta gggtggaggc cttcagcctt tcctgcagca 180 
catggggccg actgtgcacc ctgactgccc gggctcctat tcccaaggag ggtcccactg 240 
gattccagtt tccgtcagag aaggaaccgc aacggctcag ccaccaggcc ccggtgcctt 300 
gcaccccagt cctgagccag gggtctcctg tcctgaggct cagagagggg acacagcccg 360 
ccctgccctt ggggtctgga gtggtggggg tcagagagag agtgggggac accgccaggc 420 
caggccctga gggcagaggt gatgtctgag tttctgcgtg gccactgtca gtctcctcgc 480 
ctccactcac acag 494 

<210> 9 

<211> 865 

<212> DNA 

<213> Homo sapiens 

<400> 9 

gtaaggttca cgtgtgatag tcgtgtccag gatgtgtgtc tctgggatat gaatgtgtct 60 
agaatgcagt cgtgtctgtg atgcgtttct gtggtggagg tacttccatg atttacacat 120 
ctgtgatatg cgtgtgtggc acgtgtgtgt cgtggtgcat gtatctgtgg cgtgcatatt 180 
tgtggtgtgt gtgtgtgtgg cacgtgtgtg tccatggtgt gtgtgcctgt ggtgtgcatg 24 0 
tgtgtgtgtc tgtgacacgt gcatgttcat gctgtgtgct gcatgtctgt gatgtgccta 300 
tttgtggtgt gtgtgtgcat gtgtccgtga catatgcgtg tctatggcat gggtgtgtgt 360 
ggccccttgg ccttactcct tcctcctcca ggcatggtcc gcaccattgt cctcacgctc 420 
tcgggtgctg gtttggggag ctccacattc agggtcctca cttctagcat gggtgcccct 480 
gtcctgtcac agggctgggc cttggagact gtaagccagg tttgagagga gagtagggat 540 
gctggtggta ccttcctgga cccctggcac ccccaggacc ccagtctggc ctatgccggc 600 
tccatgagat ataggaaggc tgattcaggc ctcgctcccc gggacacact cctcccagag 660 
cggccggggg ccttggggct cggcaggggt gaaaggggcc ctgggcttgg gttcccaccc 720 
agtggtcatg agcacgctgg aggggtaagc cctcaaagtc gtgccaggcc ggggtgcaga 780 
ggtgaagaag tatccctgga gcttcggtct ggggagaggc acatgtggaa acccacaagg 840 
acctctttct ctgacttctt gagct 865 



<210> 10 

<211> 3782 

<212> DNA 

<213> Homo sapiens 



<400> 10 

tgtgggattg gttttcatgt gtgggatagg tggggatctg tgggattggt ttttatgagt 60 
ggggtaacac agagttcaag gcgagctttc ttcctgtagt gggtctgcag gtgctccaac 120 
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agctttattg aggagaccat atcttccttt gaactatggt cgggtttata gtaagccagg 180 
ggtgtggagg cctcccctgg gctccctgtt ctgtttcttc cactctgggg tcgtgtggtg 240 
cctgctgtgg tgtgtggccg gtgggcaggg cttccaggcc tccttgtgtt cattggcctg 300 
gatgtggccc tggctacgct ccgtccttgg aattcccctg cgagttggag gctttctttc 360 
5 tttctttctc tctttctttt cttttttttt tgataacaga gtctcgctct tttttgccca 420 

ggctggagtg gtttggcgtg atcttggctc actgcaacct gtgcttcctg agttcaagca 480 
attctcttgc ctcagcctcc caagtagctg gaattatagg cgcccaccac catgctgact 540 
aattttcgta attttagtag agacgaggtt tctccatgtt ggccaggctg gtctcgaact 6O0 
cctgacctca ggtgatcctc ccacctcggc ctcccaaagt gctgggatga caggtgtgaa 660 
10 ccgccgcgcc cggccgagac tcgcttcctg cagcttccgt gagatctgca gcgacagctg 720 

cctgcagcct tggtgctgac aacctccgtt ttccttctcc aggtctcgct aggggtcttt 780 
ccatttcatg actctcttca cagaagagtt tcacgtgtgc tgatttcccg gctgtttcct 840 
gcgtaattgg tgtctgctgt ttatcgatgg cctccttcca tttcctttag gctttgttta 900 
ttgttgtttt tccggctcct tgaaggaaaa gtttcgatta tggatgtttg aactttcttt 960 
15 tctaaacaag catctgaagt tgccgttttc cccctaaagc agggatcccg aggcccctgg 1020 

ctgtggagtg gcaccggtct ggggcctgtt aggaacccgg cgcacagcgg gaggctaggt 1080 
ggggtgtg^S gagccagcgt tcccgcctga gccccgcccc tctcagatca gcagtggcat 1140 
gcggtgctca gaggcgcaca caccctactg agaactgtgc gtgagagggg tctagattct 1200 
gtgctcctta tgggaatcta atgcctgatg atctgaggtg gaaccgtttg ctcccaaaac 1260 
20 catccccttc cccactgctg tcctgtggaa aaatcgtctt ccacgaaacc agtccctggt 1320 

accacaatgg ttggggaccc tgtgctaaag acctgcttca gcagcctctc gtcagtgttg 1380 
atatattggc ttttctgtgt tgagtccaga ataattacgg atttctgtga tgctttccgc 1440 
cgacctcaga cccacgggct atttgtgggc gtgttgcctg ctcctgggtc gggaagggtg 1500 
caggccccat gtaccttcct gttactgcct tccaggttgg ttcccagggt cgaatcgtac 1560 
25 tcgatgtggt ttcagcccac ggccctgccg ccagctcctg ggggctgggg aacatgctga 1620 

agcacagagt caccgtgcgc gtcttttgat gccccacaag ctcgaggcct cctgtgtccg 1680 
tgttagtgtg tgtcacgtgc ctgctcacat cctgtcttgg ggacgcaggg gcttagcagg 1740 
tcccgtagca aatgacaagc gtcctggggg agtctgcaga ataggaggtg ggggtgccgg 1800 
tctctctccc gcgtcttcag actcctctcc tgcctgtgct gtggctgcac ctgcatccct 1860 
30 gcaatccctc cagcactggg ccggagaggc ccgggagctc gagtgccact tgtgccacgt 1920 

gactgtggat ggcagtcggt cacgggggtc tgatgtgtgg tgactgtgga tggcggttgg 1980 
tcacaggggt ctgatgtgtg gtgactgtgg atggcggtcg cggggtctga tgtggtgact 2040 
gtggatggcg gtcgtggggt ctgatgtgtg gtgactgtgg atggcggtcg tggggtctga 2100 
* tgtggtgact gtggatggcg gtcgtggggt ctgatgtggt gactgtggat ggcggtcgtg 2160 
35 gggtctgatg tggtgactgt ggatggcagt cgtggggtct gatgtgtggt gactgtggat 2220 

ggcggtcgtg gggtctgatg tggtgactgt ggatggcagt cgtggggtct gatgtgtggt 2280 
gactgtggat ggcggtcgtg gggtctgatg tgtggtgact gtggatggcg gtcgtggggt 2340 
ctgatgtgtg gtgactgtgg atggcggtcg tggggtctga tgtgtggtga ctgtggatgg 2400 
cggtcgtggg gtctgatgtg gtgactgtgg atggcggtcg tggggtctga tgtgtggtga 2460 
40 ctgtggatgg tgatcggtca caggggtctg atgtgtggtg actgtggatg gcggtcgtgg 2520 

ggtctgatgt gtggtgactg tggatggtga tcggtcacag gggtctgatg tgtggtgact 2580 
gtggatggcg gtcgtggggt ctgatgtgtg gtgactgtgg atggcggttg gtcccggggg 2640 
tctgatgtgt ggtgactgtg gatggcgatc ggtcacaggg gtctgatgtg tggtgactgt 2700 
ggatggcggt cgtggggtct gatgtgtggt gactgtggat ggcggtcgtg gggtctgatg 2760 
45 tgtggtgact gtggatggcg gtcgtggggt ctgatgtggt gactgtggat ggcggtcgtg 2820 

gggtctgatg tggtgactgt ggatggcggt cgtggggtct gatgtgtggt gactgtggat 2880 
ggcggttggt cccgggggtc tgatgtgtgg tgactgtgga tggcggtcgt ggggtctgat 294 0 
gtggtgactg tggatggcag tcgtggggtc tgatgtgtgg tgactgtgga tggcggtcgt 3000 
ggggtctgat gtgtggtgac tgtggatggc ggtcgtgggg tctgatgtgt ggtgactgtg 3060 
50 gatggcggtc gtggggtctg atgtgtggtg actgtggatg gcggtcgtgg ggtctgatgt 3120 

ggtgactgtg gatggcggtc gtggggtctg atgtgtggtg actgtggatg gtgatcggtc 3180 
acaggggtct gatgtgtggt gactgtggat ggcggtcgtg gggtctgatg tgtggtgact 3240 
gtggatggcg gtcgtggggt ctgatgtggt gactgtggat ggcggtcgtg gggtctgatg 3300 
tgtggtgact gtggatggcg gtcgtagggt ctgatgtgtg gtgactgtgg atggcagtcg 3360 
55 gtcacagggg tctgatgtgt ggtgactgtg gatggcggtc gtggggtctg atgtgtggtg 3420 

actgtggatg gcggtcgtgg ggtctgatgt gtggtgactg tggatggcgg tcgtggggtc 3480 
tgatgtgtgg tgactgtgga tggcggtcgt ggggtctgat gtggtgactg tggatggtga 3540 
tcggtcacag gggtctgatg tgtggtagct gcaggtggag tcccaggtgt gtctgtagct 3600 
actttgcgtc ctcggccccc cggcccccgt ttcccaaaca gaagcttccc aggcgctctc 3660 
60 tgggcttcat cccgccatcg ggcttggccg caggtccaca cgtcctgatc ggaagaaaca 3720 

agtgcccagc tctggccggg gcaggccaca tttgtggctc atgccctctc ctctgccggc 3780 
ag 3782 
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<210> 11 
<211> 980 
<212> DNA 

<213> Homo sapiens 
<400> 11 

gtctgggcac tgccctgcag ggtcgggcac 
aatcactggg ctcatgaccg gacagactgt 
tgtgatgggg gcatgatgag ctgtgtgcct 
tgcgacagct gctgcattca ggcacctgct 
ccgcagtgcc tttgttcatg atttgctaaa 
caaaggaaag gtgtccccct cctttaggag 
agctggcccc tcagtgctgg gtctgaggcc 
cgggccgtgt ttgagccacg ccccgctgag 
ggccctgtgg ccctttgcag atgtggtctg 
cctgttagca cttgctcggc tctaggggac 
ctctgggcga atttccttgg ctcccagggt 
ccagaccctg tgcccggcag ctgggcagca 
cggtgggctg tgtgggtgtg agcccagctg 
gtgtcacaca ctct'gcctaa gcccatgtgt 
gatggccctg cattccagcc cagccccgca 
cggagggtct tggccacgtg gtcctgcctg 
tctcccgtct gctttcgcag 

<210> 12 
<211> 2485 
<212> DNA 

<213> Homo sapiens 
<400> 12 

gtgagtcagg tggccaggtg ccattgccct 
tgctcacctc tctcctgccc cctccccact 
ttttctggcc cccgccccct ccggctcctg 
ggctcggctt gcggcagccg gagcggagca 
ggggtgtgga gttgctcctg cgtggaggac 
tgcgccgagc gtttgagcct gcagcttgtc 
cggctctcac acgcttgtat ctctctctcc 
tcctgtccct gtcgtgtgac ccccgcgagg 
cccatctgga aagtgcgggg ttgaccgtgt 
ccatggggca ggcggcctgg gagagctgcc 
cggtggtaga gccacagtgc ctggtgccac 
cacacctccc ggcaggcatc tgcctgcgac 
ggaggaaatt cgtgcacact caaggtcatc 
ggaggcctct ctctgggatc gtctccagcg 
tttatttaaa aatataacta ttaattattg 
accataatat ttatcaaagt ataattagaa 
cacaaattgc acatggcagc agagtgaatt 
taagcggccc ccaggcccac agaattcgct 
cgggccccct tcgtggtcgt gaattttatt 
gtggcagggc ttcggggaat gtgaggtgat 
ggtgactgtg tctgtcctgt ccctaggaca 
cggcccagct tggcccccga ataaaaacgt 
acagagagag tttcccatcc catgtgctca 
gggctggccg gactcctaga gttggtgcgt 
gcccatcact gtgatatctg caccagcaag 
ttttttgaga cggaacgtca ctgttgtccg 
actcactgca acctccgcct cccgggttcc 
gctgagatta caggcaccca ccccctgcgc 
gggtttttgc catgttggcc aggctggtcc 
ctcggcctcc caaagcgctg ggattacagg 
ctttttaagg tgaccaccta tagcgcttcc 
gctgcaagcg tcccctagca acaggagtgg 
ccgcgcggca gccatgcctc ctgtgtgcac 
actgtttgtc tgaaaacgca cccctggcat 
gccatgctga aaccaggggc aaggttgtat 



ggactcccag cagtgggtcc tcccctgggc 60 . 
tggccctggg gggcagtggg gggaatgagc 120 
tggcgaaatc tgagctgggc catgccaggc 180 
cacgtttgac tgcgcggcct ctctccagtt 240 
tgtcttctct gccagttttg atcttgaggc 300 
ggcaggccat gtttgagccg tgtcctgccc 360 
aaaggaaacg tgtccccctt cttaggagga 420 
cgggcctctc agtgctgggt ctgtccacgt 480 
cccacgtggc cctgtggctc tttgcagatg 540 
agtcgtgtcc accgcatgag gctcagagac 600 
gggggtggag gtggcctggg ctgctgggac 660 
actcctggac cacatatgcc atccgggcca 720 
gacccacagg tggcccagag gagacgttct 780 
gtctgcagag actcggcccg gccagcccac 840 
cttcatcaca aacactgacc ccaaaaggga 900 
tctcagcacc caccggctca ctcccatgtg 960 

980 



gcgggtggcc gggcgggctg gcagggcttc 60 
gnccttctgc ccggggccac cagagtcccc 120 
ggctgcaggc tcccgaggcc ccggaaacat 180 
ggtgccacac gaggcctgga aatggcaagc 240 
gaggggcggg gggtgtgtct gggtcaggtg 300 
agccccaagt tactactgac gctggacacc 360 
cgatacaaaa ggattttatc cgattctcat 420 
gcgcgggctc ttctctctgt gactagattt 480 
agtttgctcc tctcgggggg cctgtggtgg 54 0 
gtcacacagc cactgggtga gccacactca 600 
atcacgtcct ctggatttta agtaaaacca 660 
cctgtgtgtg cctggggaga gtggtagcac 720 
agcaaggtca tccgcagtca ggtggaacgt 780 
gataaaggac tgtgcacagc ttcggaagct 840 
cattataagt aatcactaat ggtatcagca 900 
atactaagca gtacacacgt cctggaaaaa 960 
ttggccgagg gacacgtgtg cacatgtgtg 1020 
gacaaagcca cctccccaga gaagccacca 1080 
aagatggatc aagtcacgta ccgtccacgt .1140 
gactgcgtcc tcatgccctg acagacagga 1200 
cggacaggcc cgaagctcta gtccccatcg 1260 
cttcaaaacc tgttgcccca aaaactaaga 1320 
caggggcgta tctgcttgcg ttgactcgct 1380 
gtgcttctgt gcaaaaagtg cagtcctctt 1440 
gaaagcctct tttcttttct ctcttttttt 1500 
cctgggcttg agtgcagtgg cgcgatctca 1560 
agcatttctc ctgcctcagc ctcccgagca 1620 
ctggctaatt tttgtatttt tagtagagag 1680 
cgaacccctg acctcaggtg acccacccac 1740 
tgtgagccat cacgcccagc cggaaagcct 1800 
cgaaaataac aggtcttgtt tttgcagtag 1860 
cgtcctgtgg gctctgggga tggctgaggg 1920 
ctccaggttc cacggggcca ttctgctccc 1980 
ccttgttcgg agagtttctg cctcccgtcg 2040 
ccgttggcgc gcagcggcta catgtagggt 2100 
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catgagtctt tcaccgtgga caaattcctt 
tcattccggg tcaagtgtct ggttctgtga 
aaagaaaacc ttgatgattc agagcaagga 
agccgcccca gtgcatggtg agagtgggga 
ggtatgtttc tgaggtgttt gccggctgaa 
tctgtgtctg tgtgtggctc ggtttgagtg 
tctcacctgt gtcttcccgc cccag 

<210> 13 
<211> 1984 
<212> DNA 

<213> Homo sapiens 



gaaaaaaaaa aaaggagtcc ggttaagcat 2160 
ataaactcta agatttaaga aaccttaatg 2220 
tgtggtcaca cctgtggccg gatctgtttc 2280 
gcagggattg tttgttcaga ggtctcatct 2340 
tggtagacgt gtcgtttgtg tgtatgaggt 2400 
tacgcatgtc cagcacatgc cctgcccgtc 2460 

2485 



<400> 13 

gtgaggcctc ctcttcccca ggggggcttg ggtgggggtt gatttgcttt tgatgcattc 60 
agtgttaata ttcctggtgc tctggagacc atgactgctc tgtcttgagg aaccagacaa 120 
ggttgcagcc ccttcttggt atgaagccgc acgggagggg ttgcacagcc tgaggactgc 180 
gggctccacg caggctctgt ccagcggcca tgtccagagg cctcagggct cagcaggcgg 240 
gagggccgct gccctgcatg atgagcatgt gaattcaaca ccgaggaagc acaccagctt 300 
ctgtcacgtc acccaggttc cgttagggtc cttggggaga tggggctggt gcagcctgag 360 
gccccacatc tcccagcagg ccctcgacag gtggcctgga ctgggcgcct cttcagccca 420 
ttgcccatcc cacttgcatg gggtctacac ccaaggacgc acacacctaa atatcgtgcc 480 
aacctaatgt ggttcaactc agctggcttt tattgacagc agttactttt ttttttttaa 540 
tactttaagt tctagggtac atgtgcacga cgtgcaggtt agttacatat gtatacatgt 600 
gccatgttgg tgtgctgcac ccattaactc atcatttaca ttaggtatat ctcctaacgc 660 
tatccctccc cactcccccc atcccatgac aggccctggt gtgtgatgtt ccccaccctg 720 
tgtccaagtg ttctcattgt tcagttccca cctgtgagtg agaacatgtg gtgtttggtt 780 
ttctttcctt gcaatagttt gctcagagtg atggtttcca gcttcgtcca tgtccctaca 840 
aaggacatga actcatcctt ttttatgact gcatagtatt ccgtggtgta tatgtgccac 900 
attttcttaa tccagtctat catcgatgga catttgggtt ggttgcaagt ctttgctact 960 
gtgaatagtg ccgcaataaa catacgtgtg catgtgtctt tatagcagca tgatttataa 1020 
tcctttgggt atatacccag taatgggatg gctgggtcaa atggtatttc tagttctaga 1080 
tccttgagga atcaccacac tgtcttccac aatggttgaa ctagtttaca ctcccaccaa 1140 
cagtgtaaaa gtgttctggt gctggagagg atgtggacag cagttatttt tttatgaaaa 1200 
tagtatcacc gaacaagcag acagttagtg aaggatgcgt caggaagcct gcaggccaca 1260 
cagccatttc tctcgaagac tccgggtttt tcctgtgcat cttttgaaac tctagctcca 1320 
attatagcat gtacagtgga tcaaggttct tcttcattaa ggttcaagtt ctagattgaa 1380 
ataagtttat gtaacagaaa caaaaatttc ttgtacacac aacttgctct gggatttgga 1440 
ggaaagtgtc ctcgagctgg cggcacactg gtcagccctc tgggacagga tacctctggc 1500 
ccatggtcat ggggcgctgg gcttgggcct gagggtcaca cagtgcacca tgcccagctt 1560 
cctgtggata ggatctgggt ctcggatcat gctgaggacc acagctgcca tgctggtaaa 1620 
gggcaccacg tggctcagag ggggcgaggt tcccagcccc agctttctta ccgtcttcag 1680 
ttatttttcc ctaagagtct gagaagtggg gccgcgcctg atggccttcg ttcgtcttca 1740 
gctggcacag aattgcacaa gctgatggta aacactgagt acttataatg aatgaggaat 1800 
tgctgtagca gttaactgta gagagctcgt ctgttggaaa gaaatttaag tttttcattt 1860 
aaccgctttg gagaatgtta ctttatttat ggctgtgtaa attgtttgac attcagtccc 1920 
tcgtaga'cag atactacgta aaaagtgtaa agttaacctt gctgtgtatt ttcccttatt 1980 
ttag 1984 
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gggattgtcc aatgtggtcc ccctcaaggg 
agtgcgattt gacgagggac gagaaacctt 
tggccgccag gggtggtttc aggtgctttg 
cccgccctcc aagtccaccc tccaggtcca 
gcctggcgtt ccttgtgccg cagcccggag 
aagattcact cggggggagc ccaggtccca 
gctgagggga cagagcagac ggggaacgct 
ggccagggag gtggctcaga gtgtatgttg 
gatgagtcgg cagccatgta acaggaaggg 
ggagctgcgc agctggccga ggtcccaggg 
ggggccacag cagaggccgc aggaagggaa 
gggcacaggg gggctccctg agctgggtga 
cttgacgtga agctgacgac tggtgttgcc 
gagcaggaac tcagaaccct cccctttgtc 
aggagaaaac aggcaaagtc gttgagaaac 
tcttgtccag attttagtct gccccggacc 
tgccatgggg acacatgaga tggaccatca 
gagtcctggc tgtcccgggt ccaggccagg 
gggagacagg gaaagcaccc cgaagtctgg 
cctgccaggc ccagcaccct gctccaaatc 
aacaagggtg tcaggttacc tcctgggtga 
ctctgcctta g 



cgccccacag agccggtggg cttgttttaa 660 
gaaagctgta aagggaaccc tcagaaaatg 720 
ctgggctgtg tttgtgaaaa cccatttgga 780 
ccctccaggg ccgccctggg ctgggggtat 840 
cacagcaggc tgtgcacatt taaatccact 900 
agcaactgag ggctcaggag tcctgaggct 960 
gcttctgtgt ggcaagttcc tgagggtgct 1020 
gggtcccacc gggggcagaa ctctgtctct 1080 
gtggccacag ggagctggga atgcaccagg 1140 
ccaggccaca ggaagggcag ggggacgccc 1200 
ggggatgccc aggccagagc agaggctacc 1260 
gcgaggctca tgactcggcg agggaacctc 1320 
cagctcacag cccagccagg tcccgcgcct 1380 
taaagcacag cagatgcctt cagggcatct 1440 
gtcttaaaag aaggtgggat ggtggcaatt 1500 
acagatgagt ctataacggg attgtggtgt 1560 
cagaggccac tggggctgca cctcccatct 1620 
ttcttgcatg ctcacctacc tgtcctgccc 1680 
agcagggctg ggtccaggct cctcagagct 1740 
accacttctc tggggttttc caaagcattt 1800 
cggccccgca tcctggggct gacattgccc 1860 

1871 



<210> 15 
<211> 3801 
<212> DNA 

<213> Homo sapiens 
<400> 15 

gtgagcgcac ctggccggaa gtggagcctg 
ccgttgcgtc cacctctgct tccgtgtggg 
ggccacaggg tgcccctcgt cccatctggg 
tgagggtgct cacaacggga gcagttttct 
cagacctggg tgcactgagg tgtcttcaga 
gggccctgct gggcgtgagt ctctcaaacc 
cctctgaacc cgagaccctg gggccctgct 
cagggccctt ttgggcgtga gtctctccgc 
agtctacagg atgccatgag ttcatgatca 
tgtggggggg gtctctacaa aattctgggg 
gccccgtctc aggctcagac acaaatgaat 
ctgtttcttt tatgaataaa aagtatcaac 
ataatcccag cactttggga ggccgaggtg 
ccaacctaac caacatagtg aaattccatt 
cctggtggca cacgcctgta gtccccgcta 
aacccaggag gcagaggttg cagtgagccg 
acagagtgag acttcatctt aaaaaaaaaa 
ggacaggtgt ttttttattc tgtccttcga 
gaactggggg tgccttcctc tgaaaggcac 
tggttgttaa accagaggtt taaactgggg 



tgcccggctg gggcaggtgc tgctgcaggg 60 
gcaggcgact gccaatccca aagggtcaga 120 
gctgagcaga aatgcatctt tctgtgggag 180 
gtgctatttt ggtaaaagga aatggtgcac 240 
aagcagtctg gatccgaacc caagacgccc 300 
cgaacacagg ggccctgctg ggcatgagtc 360 
gggcgtgagt ctctccgaac ccagagactt 420 
tgtgagcccc acactccaag gctcatccac 480 
cgtgtgaccc atcaggggac agggccatgg 540 
tcttgtttcc ccagagcccg agagctcaag 600 
tgaagatgga cacagatgca gaaatctgtg 660 
attccaggca gggcaaggtg gctcacacct 720 
ggtggatcac ttgaggccag gagtttgagg 780 
tctacttaaa aaatacaaaa attagcctgg 840 
tgcgggaggc tgaggcagga gaatcatttg 900 
agatcacacc actgcactcc agcctgggca 960 
aaaaaagtat cagcattcca aaaccatagt 1020 
taatatttac tggtgctgtg ctagaggccg 1080 
accttcatgg gaagagaaat aagtggtgaa 1140 
tcctgtcgtt ctgagttaac agtccagatc 1200 
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gactggaagc aaataagttg tgtctttaca gcatatacca gagcagattc taggtagaag 2220 
aggagacaca tgcaaacaac accagcaaca gaaataaaac aaaagactca aagggaaggg 2280 
aggtgaacgt tccctggttt ggtgttgggg aaggacacac agggaggcgg atgaaaccag 2340 
tgaggcaacg ggcattgctt tcactgcaga gaaactcagc ttgcctgagc cacagtgaaa 2400 
atggccattc cctggagcgt ttgtgcacgt gatttattta aggcgccctg tgaggtcctg 2460 
cacattcatc ctctcacttt gttctcctaa ccacctgaga ggtagaggag gaaaggctcc 2520 
aggggagcag ccgcccttgg tcacccagct ggcaaagggc atgcatgatt gcagcctggc 2580 
ctcctgctcc ggggcccttg ctctgcccga ggaccccaca caagtcagac ccataggctc 264 0 
agggtgagcc ggagcccaag gtcgtgttgg ggatggctgt gaaagaagaa atggacgtct 2700 
gatgcacact tgggaaggtc ctaccagcag cgtcaaagaa atgcatgtga aactgacagc 2760 
gagacccatc cctcaaagaa acgcacgtga aaccgatggc gagacctgtc cccatccctc 2820 
atgctggctc cttttctggg cttgccaaga gccagcatca ggttgaggca agctggaaag 2880 
acttttctgg aaagcagctt gtttgcatgg aagtcctcac aatgtcctgt gtcttcccag 2940 
taattccact tctgaagtga ccagacatta tcacgggtct tatttaccat ttccagtgtt 3000 
ccaggcaggg ggacttgcca cagcaagtca cgaacctgcc caaatacagg gctaaggaga 3060 
tattatgcat cacaaaactt gctctgccat taaacatttt tcaaagaatt tttgaagaac 3120 
gtttaatggc acaaaacgtt tatttcaatg tagcagtgtt caaagctgga tgtaaaagaa 3180 
cacaccccag gagcctgccg tgaatgtcat gtgtgttcat ctttggacat ggacatacat 3240 
gggcagtgag tggtggtgag gccctggagg acatcggtgg gatgcctcca tcctgcccct 3300 
ctggagacac catgtgtgcc acgtgcactc actggagccc tgtttagctg gtgccacctg 3360 
gctcttccat ccctgagatt caaacacagt gagactcccc acgcccaact cagtgttctc 3420 
ccacaaaaaa cctgagtcac acctgtgttc actcgaggga cgcccgggag ccagggct cc 3480 
acagtttatt atgtgttttt ggctgagtta tgtgcagatc tcatcagggc agatgatgag 3540 
tgcacaaaca cggccgtgcg aggtttggat acactcaaca tcactagcca ggtcctggtg 3600 
gagtttggtc atgcagagtc tggatggcat gtagcatttg gagcccatgg agtgagcacc 3660 
cagccccctc gggctgcagc gcatgcccca ggcaggacaa ggaagcggga ggaaggcagg 3720 
aggctctttg gagcaagctt tgcaggaggg ggctgggtgt ggggcaggca cctgtgtctg 3780 
acattccccc ctgtgtctca g 3801 

<210> 16 

<211> 880 

<212> DNA 

<213> Homo sapiens 

<400> 16 

gtgagcaggc tgatggtcag cacagagttc agagttcagg aggtgtgtgc gcaagtatgt 60 
gtgtgtgtgt gtgcgcgcgt gcctgcaagg ctgatggtga ctggctgcac gtaagagtgc 120 
acatgtacgc atatacacgt gagcacatac atgtgtgcat gtgtgtacat gaaggcatgg 180 
cagtgtgtgc acaggtgtgc aagggcacaa gtgtgtgcac atgcgaatgc acacctgaca 24 0 
tgcatgtgtg ttcgtgcaca gtcgtgtggg cattcacgtg aggcgcatgc gcgtgggtgt 300 
gcagtgtgag tagcatgtgt gcacataaca tgcattgagg ggtccccgtg ttcaccccgc 360 
taggtcctca gcaccagtgc cactccttac aggatgagac ggggtcccag gccttggtgg 420 
gctgaggctc tgaagctgca gccctgaggg cattgtccca tctgggcatc cgcgtccacc 480 
ccctctcctg tgggcttctg tgtccactcc ccctctcctg tgggcattta catccactcc 540 
actccctctc tcctgtgggc atccgcgtcc actccccctc tctgtgggca tctgcgtcca 600 
cctcccctct ccgtgggcat ttgcgtccac tccctcccct ggtcccttcc tgtcttggcc 660 
gagcctcggg ggcaggcaga tgacacagag tcttgactcg cccagggtgg ttcgcagctg 720 
ccgggtgagg gccaggccgg atctcactgg gaagagggac agtttcttgt caaaatgttc 780 
ctctttcttg ttccacctga atggatgata aagcaaaaag taaaaactta aaatcccaga 840 
gaggtttcta ccgtttctca ctctttcttg gcgactctag 880 

<210> 17 

<211> 3186 

<212> DNA 

<213> Homo sapiens 

<400> 17 

gtgagccgcc accaaggggt gcaggcccag cctccaggga ccctccgcgc tctgctcacc 60 
tctgacccgg ggcttcacct tggaactcct gggttttagg ggcaaggaat gtcttacgtt 120 
ttcagtggtg ctgctgcctg tgcacagttc tgttcgcgtg gctctgtgca aagcacctgt 180 
tctccatctc tgggtagtgg taggagccgg tgtggcccca ggtgtcccca ctgtgcctgt 240 
gcactggccg tgggacgtca tggaggccat cccagggcag caggggcatg gggtaaagag 300 
atgtttatgg ggagtcttag cagaggaggc tgggaaggtg tctgaacagt agatgggaga 360 
tcagatgccc ggaggatttg gggtctcagc aaagagggcc gaggtgggtg caggtgaggg 4 20 
tcgctggccc cacccccggg aaggtgcagc agagctgtgg ctccccacac agcccggcca 4 80 
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gcacctgtgc tctgggcatg gctgtgctcc tggaacgttc cctgtcctgg ctggtcaggg 540 
ggtgcccctg ccaagaatcg acaactttat cacagaggga agggccaatc tgtggaggcc 600 
acagggccag cttctgcctg gagtcagggc aggtggtggc acaagcctcg gggctgtacc 660 
aaagggcagt cgggcaccac aggcccgggc ctccacctca acaggcctcc cgagccactg 720 
ggagctgaat gccaggaggc cgaagccctc gccccatgag ggctgagaag gagtgtgagc 760 
atttgtgtta cccagggccg aggctgcgcg aattaccgtg cacacttgat gtgaaatgag 840 
gtcgtcgtct atcgtggaaa cccagcaagg gctcacggga gagttttcca ttacaaggtc 900 
gtaccatgaa aatggttttt aacccgagtg cttgcgcctt catgctctgg cagggagggc 960 
agagccacag ctgcatgtta ccgcctttgc accagctcca gaggcttggg accaggctgt 1020 
ctcagttcca gggtgcgtcc ggctcagacc gccctcctct ctgccttctc tctctgcctc 1080 
aaatcttccc tcgtttgcat ctccctgacg cgtgcctggg ccctcgtgca agctgcttga 1140 
ctccttcccg gaaacccttg gggtgtgctg gatacaggtg ccactgagga ctggaggtgt 1200 
ctgacactgt ggttgacccc agggtccagc tggcgtgctt ggggcctcct cgggccatga 1260 
tgaggtcaga ggagttttcc caggtgaaaa ctcctgggaa actcccaggg ccatgtgacc 1320 
tgccacctgc tcctcccata ttcagctcag tcttgtcctc atttccccac cagggtctct 1380 
agctccgagg agctcccgta gagggcctgg gctcagggca gggcggctga gtttccccac 1440 
ccatgtgggg acccttgggt agtcgcttga ttgggtagcc ctgaggaggc cgagatgcga 1500 
tgggccacgg gccgtttcca aacacagagt caggcacgtg gaaggcccag gaatccccct 1560 
ccctcgaggc aggagtggga gaacggagag ctgggccccg atttcacggc agccaggctg 1620 
cagtgggcga ggctgtggtg gtccacgtgg cgctgggggc ggggtctgat tcaaatccgc 1680 
tggggctcgg ccttcctggc ccgtgctggc cgcgcctcca cacgggcttg gggtggacgc 1740 
cccgacctct agcaggtggc tatttctccc tttggaagag agcccctcac ccatgctagg 1800 
tgtttccctc ctgggtcagg agcgtggccg tgtggcaacc ccgggacctt aggcttattt 1860 
atttgtttaa aaacattctg ggcctggctt ccgttgttgc taaatgggga aaagacatcc 1920 
cacctcagca gagttactga gaggctgaaa ccggggtgct ggcttgactg gtgtgatctc 1980 
aggtcattcc agaagtggct caggaagtca gtgagaccag gtacatgggg ggctcaggca 2040 
gtgggtgaga tgaggtacac ggggggctca ggcagtgggt gaggccaggt acatgggggg 2100 
ctcaggcact gggtgagatg aggtacacgg ggggctcagg cagagggtca gaccaggtac 2160 
acgggggctc tgatcacacg cacatatgag cacatgtgca catgtgctgt ttcatggtag 2220 
ccaggtctgt gcacacctgc cccaaagtcc caggaagctg agaggccaaa gatggaggcc 2280 
gacagggctg gcgcggtggc ccacacctgt agtcccagca ctttgggagg ccgaggcgag 2340 
aggatccctt gagcccagga gtttaagacc agcctgagca acatagtaga accccatctc 2400 
tatgaaaaat aaaaacaaaa attagctgaa catggtggtg tgcgcctgta gttccaatac 2460 
ttgggaggct gaagtgggag gatcacttga gcccaggagg tggaagctgc agtgagctga 2520 
gattgcacca ctgtactgca gcctgggtga cagagtgaga gcccatctca acaacaacaa 2580 
agaagactga caaatgcagt ctcttggaaa gaaacattta gtaggaactt aacctacaca 2640 
cagaagccaa gtcggtgtct cggtgtcagt gagatgagat gacgggtccc cacaccatca 2700 
ccccagaccc agggtttatg caccacaggg gcgggtggcc cagaagggat gcgcaggacg 2760 
ttgatatacg atgacatcaa ggttgtctga cgaagggcag gattcatgat aagtacctgc 2820 
tggtacacaa ggaacaatgg ataaactgga aaccttagag gccttcccgg aacaggggct 2880 
aatcagaagc cagcatgggg ggctggcatc caggatggag ctgcttcagc ctccacatgc 294 0 
gtgttcatac agatggtgca cagaaacgca gtgtacctgt gcacacacag acacgcagct 3000 
acccgcacac acaagcacac acacagacat gcatgcatgc atccgtgtgt gtgcacctgt 3060 
gcccatgagg aaacccatgc atgtgcattc atgcacgcac acaggcaccg gtgggcccat 3120 
gcccacaccc acgagcaccg tctgattagg aggcctttcc tctgacgctg cccgccatcc 3180 

3186 

tctcag 



<210> 18 

<211> 781 

<212> DNA 

<213> Homo sapiens 



<400> 18 

gtatgtgcag gtgcctggcc tcagtggcag cagtgcctgc ctgctggtgt tagtgtgtca 60 
ggagactgag tgaatctggg cttaggaagt tcttaccccc tttcgcatca ggaagtggct 120 
taacccaacc actgtcaggc tcgtctgccc gccctcccgt ggggcgagca gagcacctga 180 
tggaagggac aggagctgtc tgggagccgc catccttccc accttgccct gcctggggaa 240 
gcgctggggg gcctggcctc ccctgtttgc cccatggtgg gatttggggg gcccggcctc 300 
ccctgtttgc cctgtggtgg gatcgggctg tctcccgtcc acggcactta gggccctcgt 360 
gcaaacccag gccaagggct taggaggagg ccaggcccag gctaccccac ccctctcagg 420 
agcagaggcc gcgtatcacc acgacagagc cccgcgccgc cctctgcttc ccagtcaccg 480 
tcctctgccc ctggacactt tgtccagcat cagggaggtt tctgatccgc ccgaaatcca 540 
agccacgtcg aacctgcggt cctgagctta acagccccta cttcccgtcc tctctgcgct 600 
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gtggaaattt cacctggaga agccgaagaa aacatttctg tcgtgactcc tgcggtgctt 660 
gggtcgggac agccagagat ggagccaccc cgcagaccgt cgggtgtggg cagctttccg 720 
gtgtctcctg ggaggggagc tgggctgggc ctgtgacccc tcagcctctg ttttccccca 760 



<210> 19 

<211> 536 

<212> DNA 

<213> Homo sapiens 

<400> 19 

gcaagtgtgg gtggaggcca gtgcgggccc cacctgccca ggggccatcc ttgaacgccc 60 
tgtgtggggc gagcagcctc agatgctgct gaagtgcaga cgcccccggg cctgaccctg 120 
ggggcctgga gccacgctgg cagccctatg tgattaaacg ctggtgtccc caggccacgg 180 
agcctggcag ggtccccaac ttcttgaacc cctgcttccc atctcagggg cgatggctcc 240 
ccacgcttgg gagccttctg acccctgacc tgtgtcctct cacagcctct tccctggctg 300 
ctgccctgag ctcctggggt cctgagcaag tcctctcccc gccccgccgc tccagcgtca 360 
ctgggctgcc tgtctgctcg ccccggtgga ggggtgtctg tcccttcact gaggttccca 420 
ccagccaggg ccacgaggtg caggccctgc ctgcccggcc acccacacgt cctaggaggg 480 
ctggaggatg ccacctctgg cctcttctgg aacggagtct gattttggcc ccgcag 536 

<210> 20 ' 

<211> 3179 

<212> DNA 

<213> Homo sapiens 



<400> 20 

atctcatgct tgaatcctaa tgtgcactgc 
ctgtgagtga acggggtggt ggtcagtgcg 
gtctatgagt gaatggggtt gtggtcagtg 
tttctgatgc tgtgaggcag gaggggaagg 
ccctggaaga cataacagta agtccaggcc 
cttgggcggc ggggatgatg gagggcctgg 
ctggggtggc aggggtgatg gggggggctg 
ggctgggccc cctcctcccc tgcctcccac 
ggtgcacatc ctctgggcca tcagctttca 
cctgtataaa atccaggatt cctcctcctg 
ccgcctctgg ccattctctt aagagtagac 
gtggggcagt ggagggtgtg gacacaggag 
atcctcttat catctcccag tctcatctct 
tcttcctctt atctcccagt ctcatctgtc 
tatcctctta tctcctagtc tcatccagac 
gtggagctgg acatacgtcc ttcctcaggc 
gaggggcggc tcagagggac gcagtcttgg 
gcttgggcca cacgaaaccg agggccctgc 
cctggtgggg ccttatggta tggccgggtc 
gtttgagtgc agcccggacg tgcctggtgt 
gcgtcattta ttgctgctgc ttcagagaat 
gggcccaagt ccacagactg tgtcgtaaat 
agctgtgagg aaggaggggc tcttggcagc 
ggaagggagc ggccccgggc gccgtgggcg 
agggcgggga cttcccagga gcagaggccg 
gaccaacagg tcaggccatt gttcagctat 
tctccgggtg ttttttgttg aaattttact 
tagaccctta aaaaaggtat ttgctttgat 
ttgtctgctt ttatttatca ttattattat 
ggttgttagt gcagtggcac agccatggct 
gatcctccgg cctcagcttc ccagagtgct 
ctggcacttt taaaaaccac tatgtaaggt 
cagtagtttg ggaagccgag gcagaaggac 
gggtaacaca gggagacccc atctctacaa 
ccagcatctg tagtcccagc tgctcgggag 
ggtcacggct gcagtgagct gtgattgtac 
gaccctgtct caaaaaaaaa aaaaaaaaaa 
gaaggaaaga gaagaagaag gaagaaggaa 



atagacacca ctgtatgcaa ttacagaagc 60 
ggcccatggc ctggctgtgc atttacggaa 120 
cgggcccatg gcctggccgg gcctgggagg 180 
agggtagggg atagacagtg ggagccccca 240 
cgaagggcag cagggatgct gggggcccag 300 
ccagggtggc agggatgatg ggggccccag 360 
gcctgggtgg cggggaagat ggggaagcct 420 
ctgcagccgc ggatccggat gtgcttccct 4 80 
tggaggtggg gggcaggggc atgacaccac 540 
aacgccccaa ctcaggttga aagtcacatt 600 
caggattctg atctctgaag ggtgggtagg 660 
gcttcagggt ggggctggtg atgctctctc 720 
catcctctta tcatctccca gtctcatctg 780 
atcctcttac catctcccag tctcatctct 840 
ttacctccca gggcgggtgc caggctcgca 900 
agaaggaact ggaaggattg cagagaacag 960 
ggtgaagaaa cagcccctcc tcagaagttg 1020 
gtgagtggct ccagagcctt ccagcaggtc 1080 
ctactgagtg caccttggac agggcttctg 1140 
cggggtgggg gcttatggcc actggatatg 1200 
gtctgagtga ccgagcctaa tgtgtatggt 1260 
gcactctggt gcctggagcc cccgtatagg 1320 
cggcctgggg gcgcctttgc cctgcaaact 1380 
gacgacctca agtgagaggt tggacagaac 144 0 
ctgctcaggc acacctgggt ttgaatcaca 1500 
ccatcttcta caaagctcca gattcctgtt 1560 
caggattact tatatttttt gctaaagtat 1620 
atggcttaac tcactaagca cctactttat 1680 
tattagagat ggtgtctact ctgtcaccca 174 0 
cgctgtagcc gcaaaccccc aggctcaagt 1800 
gggattacag gtgtgagcca ctgcccttgc 1860 
caggtccagt ggcttccaca cctgtcatcc 1920 
tgtctgaggc caggagtttg agaccagcat 1980 
aaaatgcaaa aagttatccg ggcgtggggt 204 0 
gctgagtggg aggatcgctt gagcccggga 2100 
catcgcactc cagcctgggc aacagagtga 2160 
gaaggagaag gagaagagaa gaagaaggaa 2220 
gaaagaagga gaaggaggcc tgctaggtgc 2280 
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taggtagact gtcaaatctc agagcaaaat 
aaccccagct ctttggactt ccctaggcct 
gacaagcgtg tatggagcga gtgagttcaa 
ggaggctgtg ggtgacacca gccaggaccc 
gccccacgct cctgccggtc ctgcacctgc 
acctgggaag gatgctgtgc agggggcttg 
gcacttgtgg caggcacaat tacagcccct 
acctgtgaat gtgtcacccg caaggcagag 
tgccagtcag ccgatcttaa ggtcatcctg 
gggtccctag aagtgagaga gggaggcagg 
cactggccac tgctggcctt gagatggagg 
ccgctccatg ctggaaaagc aagcaatcct 
acgcctcgat ttcaggccag tgggacctgt 
tgatgcgttt gtgttcagcc actaagctgc 
cagtacaggg aaatgaatac agggacagtt 



gaaaat'aaca aagttttaaa gggaaagaaa 2340 
gaacttcatc tcaagcagct tccttccaca 2400 
agcagaaagg gaggagaagc aggcaagggc 2460 
ctgaaaggga gtggttgttt tcctgcctca 2520 
tgtaaccgtc gatgttggtg ccaggtgccc 2580 
ccaaactttg gtgggtttca gaagccccag 2640 
ccccaaagat gcccacgtcc ttctcctgga 2700 
gctggtgaag gctgcaggtg gaatcacggc 2760 
gattatctgg tgggcctgat atggccacaa 2820 
ggagagtcag agaggggacg tgagaaggac 2880 
agggggtccc cagccaagga atgggggcag 2940 
ccccggtcct gagggcacac ggccctgccc 3000 
ttcagctttc cggcctccag agctgtaaga 3060 
agtgattcgt cacagcagca aatggaatag 3120 
ctcagagtga ctctcagccc acccctggg 3179 



